Virtual Jarvis. Typle - Computer de control vocal

Majoritatea utilizatorilor știu că sistemul Siri este considerat cea mai populară tehnologie de asistență personală și interogare pe gadget-urile iOS. Din fericire, nu numai sistemul Siri este disponibil pe piață. Deci, fanii ficțiunii și benzi desenate create de Marvel, un asistent personal Jarvis din filmul "Iron Man" este oferit.

Dacă proprietarul aparatului a văzut filmul "Iron Man", atunci este cu siguranță cunoscut Butler Tony Stark, al cărui nume este Jarvis. În consecință, utilizatorul va putea să recurgă la ajutorul unui funcționar virtual pe cont propriu aparate portabile. În plus, programul Jarvis este o dezvoltare unică care aplică voce și imaginea caracterului Jarvis.

Funcționarea utilității Jarvis începe cu instrucțiuni audio convenționale pentru utilizarea și gestionarea instrumentului specificat. La sfârșitul instalării, utilizatorul va trebui să specifice sexul (astfel încât asistentul virtual să poată accesa corect proprietarul dispozitivului). În plus, va trebui să stabilească o unitate de măsurare a principalelor condiții de temperatură (în special grade în Kelvin, Fahrenheit sau, desigur, Celsius).

Vă puteți familiariza cu o listă detaliată a instrucțiunilor, atingând pictogramele plasate în colțul superior al afișajului. În același timp, toate echipele trebuie să înceapă cu siguranță cu apelul "Jarvis" și, de obicei, conține un cuvânt (de exemplu, "Jarvis, prognoza meteo"). Jarvis știe, de asemenea, cum să notifice proprietarul dispozitivului viitoarelor întâlniri și să afișeze ora curentă. O varietate de nume audio pot fi create în program.

Este important să rețineți că proprietarii de discuri optice cu un bloc de film "Fier Man" oferă utilitarul Jarvis caracteristici suplimentare. De exemplu, utilizatorul poate gestiona cu ușurință redarea filmului corespunzător utilizând acest butler virtual.

Informații utile: Dacă întrebați întrebarea dvs. asistent virtuală: merită să cumpărați un BMW 740 (http://www.bmw-avtoport.ru/auto/7/), atunci răspunsul său cu o probabilitate de o sută la sută va fi afirmativ! Apropo, puteți achiziționa seria BMW a șaptea chiar acum în cele mai profitabile condiții pentru tine! Tot ce trebuie să faceți pentru aceasta este să vizitați site-ul www.bmw-avtoport.ru.

Astăzi vom vorbi despre discursul nostru. Aș vrea să vă rog conducerea unei voce de computer, fără ajutorul degetelor tale? Și, așa cum spun ei, - puterea gândirii! Adevărat, nu vom gestiona computerul prin puterea gândirii, dar acest lucru este foarte realist.

Typle program - Acesta este unul dintre cele mai bune programe de gestionare a unui computer prin voce. Pe site-urile din comentariile la acest program, opiniile converg.

Adevărat Există deficiențele dvs. Dar mai târziu mai târziu. Apropo, dacă sunteți interesat de - citiți recenzia mea.

Puteți descărca programul aici: http://freesoft.ru/typle

Cum să-l folosească? La început, lansați-l și vedeți butoanele principale de control:

Programul ne salută și ne oferă imediat solicitări cum să utilizați Typle. La început, faceți clic pe butonul Adăugare și scrieți un cuvânt, cum ar fi "Deschidere". Pentru a face acest lucru, spuneți acest cuvânt în microfon:

Apoi faceți clic pe Adăugare. Deci, am salvat cuvântul "deschis" în program. Puteți vorbi în microfon orice alte cuvinte. Principalul lucru nu este să se confunde.

Următorul pas va adăuga comenzi. Pentru a face acest lucru, să mergem la acest punct:

Apoi am stabilit o bifată opusă acelui element de care avem nevoie:

Selectați programul, aplicația sau acțiunea și faceți clic pe butonul RED RECORD. Dacă computerul a perceput vocea noastră, faceți clic pe "Adăugați":

Și acum va fi vizibil în profilul nostru unul echipa de voce. ÎN acest caz Cel care deschide 7-zip:

Și acum făcând clic pe butonul final "Start Talk"

vorbim expresia "Zip de semințe deschise". În cazul meu, totul va funcționa. Și programul 7-Zip se va deschide. Amintiți-vă o astfel de frază: SIM SIM deschis? Acesta este ceva aproximativ același.

Programul nu funcționează întotdeauna în mod adecvat. Acum, limba rusă puternică nu este studiată pe deplin de programatori lingvistici ... dar încă frumos când computerul vă ascultă.

Prin urmare, pentru testarea și curiozitatea banală, programul Typle va satisface 100%.

În acest videoclip, puteți vedea istoria creării primelor motoare vocale și ce altceva ar trebui să lucrăm la:

Există nume atât de teribile ale altor analogi ai programului, cum ar fi Gorynych, Perpetuum, Dotograf, comandant vocal. Dar toți nu sunt "nu asta. Nu criticați un program decent.

Am mers timp de 5 minute pentru a stăpâni acest program. Acest lucru este destul de mult timp (în principal în astfel de programe înțeleg 1-2 minute). Dacă apar întrebări - scrieți. Până la întâlniri, prieteni :)!

De mult timp nu am părăsit ideea "Jarvis" și de gestionarea tehnicii în casa vocii. Și în cele din urmă, mâinile au ajuns la crearea acestui miracol. Nu trebuia să mă gândesc la "creier" pentru o lungă perioadă de timp, Raspberry Pi este potrivit.

Astfel încât fier:

Raspberry Pi 3 Model B
Camera USB Logitech.

Vânzări

Asistentul nostru va lucra pe principiul Alexa / Hub:

Activați offline pe un anumit cuvânt
Recunoașteți o comandă în nor
Rulați comanda
Raport privind efectuarea lucrărilor sau informarea informațiilor de solicitare

pentru că Camera mea este acceptată din cutie, nu a trebuit să te încurci cu șoferii, așa că mergem imediat la partea programului.

Activarea offline

Activarea va avea loc cu CMU SPHINX, iar totul ar fi bine, dar recunoașterea este foarte lentă din cutie, mai mult de 10 secunde, ceea ce nu este absolut potrivit, pentru a rezolva problema de care aveți nevoie pentru a elimina dicționarul din cuvintele inutile.

Instalați tot ce aveți nevoie:

PIP3 Instalați Speechecognition PIP3 Instalați PocketSphinx
Mai departe

Sudo nano /usr/local/lib/python3.4/dist-packages/speech_recognition/pocketsphinx-data/en-us /pronouciation-dictionary.dict
Îndepărtăm totul cu excepția lui Jarvis Avem nevoie de:

Jarvis jh aa r v ah s
Acum, PocketSphinx recunoaște destul de repede.

Recunoaștere a vorbirii

La început a existat o idee de a utiliza serviciul Google, iar sprijinul său este în vorbirea. Dar, după cum sa dovedit, Google ia bani pentru asta și nu funcționează cu Phys. Persoane.

Beneficiul lui Yandex oferă, de asemenea, o astfel de oportunitate, liberă și extrem de simplă.

Ne înregistrăm, primim API-ul cheie. Toate lucrările pot fi curl'om.

CURL -X POST -H "Tip de conținut: Audio / X-WAV" - Data-binar "@File" "https://asr.yandex.net/asr_xml?uuid\u003dya_uid&key\u003dyf_api_key&topic\u003dqueries»

Sinteza vorbirii

Aici Yandex ne va ajuta din nou. Trimitem textul ca răspuns pentru a obține un fișier cu text sintetizat.

Curl "https://tts.voictech.yandex.net/generate?Format\u003dwav&lang\u003dru-ru&speaker\u003dzahar&motion\u003dGood&key\u003dya_api_key" -G-Data-urlencode "text \u003d text"\u003e Fișier

Jarvis.

Noi colectăm împreună și obținem un astfel de script.

#! / USR / BIN / ENV Python # - * - Codificare: UTF-8 - * - Import OS Import Discurs_Recognition AS SR de la XML.DOM Import MiniDom IMPORT SYS IMPORT RANDOM R \u003d SR.RECOGNIZER (YA_UIUID \u003d "" YA_API_KEY \u003d " # Os.system ("echo" assist + ut zap + oraș "| festival --tts-language english") def convert_ya_asr_to_key (): xmldoc \u003d minidus.xml ") itemlist \u003d xmldoc.getelementsbytagname ("Varianta"), dacă len (itemlist)\u003e 0: return iglist.firstchild.nodevalue altfel: return FALSE DEF JARVIS_ON (): cu sr.wavfile ("Trimite.wav") ca sursă: Audio \u003d R.Record (sursă) Încercați: T \u003d R.recognize_sphinx (Audio) Print (T) cu excepția LookuPerror: Imprimare ("nu a putut înțelege audio") Return T \u003d\u003d ("jarvis") Def jarvis_say (frază): os.system ("curl" https: . ("aplay jarvis_speech.wav") Def jarvis_say_good (): fraze \u003d ["gata", "făcut", "ascultă "," Au "," altceva? ",] Randitem \u003d Random.Choice (fraze) Jarvis_say (Randitem) Încercați: În timp ce este adevărat: os.system (" Ascord -b --Buffer-time \u003d 1000000 -F DAT -R 16000 -d 3 -d plughw: 1.0 Trimitere.wav ") Dacă Jarvis_on (): OS.System (" APLAY JARVIS_ON.WAV ") OS.System (" Ascord -b --Buffer-time \u003d 1000000 - F DAT -R 16000 -d 3 -d plonjw: 1.0 Trimite-te.wav ") os.system (" curl -x post-h "tip de conținut: audio / x-wav" --da-binar "@send .wav" "https: . comanda_key în ['key_word ",' key_word1 ',' key_word2"]): os.system ('') jarvis_say_good () Continuați cu excepția excepției: jarvis_say ("ceva a mers greșit")
Ce se petrece aici. Rulați o buclă infinită, ACCord'om scrie trei secunde și trimite SPHINX la recunoaștere dacă cuvântul "jarvis" se găsește în fișier

Dacă jarvis_on ():
Pierdem în dosarul Activare Activare Advance înregistrat.

Încă mai scriem 3 secunde și trimitem Yandex, primesc echipa noastră ca răspuns. Apoi efectuați acțiuni bazate pe comandă.

De fapt, totul. Scenariile de performanță pot veni cu un set excelent.

Utilizare caz.

Acum câteva exemple de utilizare reală

Philips Hue.

Instalare

PIP Install Phue.
În aplicația Hue, instalați IP static:

Alerga:

#! / USR / BIN / PYTHON IMPORT SYS de la Bridge de Import Phue B \u003d Podul ("192.168.0.100") # Introduceți Podul IP aici. #If Rularea pentru prima dată, apăsați butonul pe Bridge și rulați cu B.Connect () neobișnuit # B.Connect () Imprimare (B.Get_scene ())
Noi scriem ID-ul schemelor dorite, formularul "470D4C3C8-on-0"

Versiunea finală a scriptului:

#! / USR / BIN / PYTHON IMPORT SYS de la Bridge de Import Phue B \u003d Podul ("192.168.0.100") # Introduceți Podul IP aici. #If Rularea pentru prima dată, apăsați butonul pe Bridge și rulați cu B.Connect () neobișnuit # B.Connect () dacă (sys.argv \u003d\u003d "off"): B.Set_light ("On", False) Altfel: b.activevabe_scene (1, sys.argv)
Adăugați la jarvis:

Dacă (comanda_key în ["lumină", \u200b\u200b"aprinde lumina", "lumina"]): os.system ("python3 /home/pi/smarthome/hue/hue.py A1167AA91-on-0) jarvis_say_good () Continuați Dacă (Command_key în ["Lumină", \u200b\u200b"Mute Light"]): OS.System ("Python3 /home/pi/smarthome/hue/hue.py AC637E2F0-on-0") Jarvis_say_Good () Continuați dacă (comanda_key în [ "Opriți lumina", "Opriți lumina"]): OS.System ("Python3 /Home/pi/smarthome/hue/hue.py" off ") jarvis_say_good () Continuați

LG TV.

Luăm scenariul de aici. După prima pornire și introducerea codului de conjugare, codul însuși nu se schimbă, astfel încât să puteți tăia această parte din script și să lăsați numai controlul.

Adăugați la jarvis:

# 1 - Power # 24 - Volune_up # 25 - volum_down # 400 - 3d_video dacă (comanda_key în ["TWN TWC", "Opriți televizorul"]): OS.System ("Python3 / Home / Pi / Smarthome / TV / TV2. PY 1 ") Jarvis_say_Good () Continuați dacă (comanda_key în [" adăugați volum "," mai tare "]): os.system (" python3 /home/pi/smarthome/tv/tv2.py 24 ") jarvis_say_good () Continua

Radio

Sudo apt-get instalare mpg123
Adăugați la jarvis:

Dacă (Command_key în [Știri "," Opriți știrile "," Ce se întâmplă "]: OS.System (" MPG123 URL) Continuați
Puteți să puneți în continuare acasă și să gestionați totul prin Siri, dacă nu terminați jarvisul.

În ceea ce privește calitatea recunoașterii vorbirii, nu Alexa, desigur, dar la o distanță de 5 metri procentul de ingredienți credincioși. Principala problemă este un discurs de la televizor \\ Difuzoarele sunt înregistrate cu comenzile și interferează cu recunoașterea.

Asta e tot, mulțumesc.

Etichete: