Jarvis virtual. Topan - Komputer Kontrol Suara

Sebagian besar pengguna tahu bahwa sistem Siri dianggap sebagai asisten pribadi dan teknologi pertanyaan paling populer di iOS gadget. Untungnya, tidak hanya sistem SIRI yang tersedia di pasaran. Jadi, penggemar fiksi dan komik dibuat oleh Marvel, jarvis asisten pribadi dari film "Iron Man" ditawarkan.

Jika pemilik perangkat melihat film "Iron Man", maka itu tentu saja diketahui oleh Butler Tony Stark, yang namanya Jarvis. Akibatnya, pengguna akan dapat menggunakan bantuan hamba virtual sendiri alat portabel. Selain itu, program Jarvis adalah pengembangan unik yang menerapkan suara dan gambar karakter Jarvis.

Pengoperasian utilitas Jarvis dimulai dengan instruksi audio konvensional untuk menggunakan dan mengelola alat yang ditentukan. Pada akhir pengaturan, pengguna perlu menentukan jenis kelaminnya (sehingga asisten virtual dapat mengakses pemilik perangkat). Selain itu, ia harus menetapkan unit pengukuran kondisi suhu utama (khususnya, derajat di Kelvin, Fahrenheit, atau, tentu saja, Celsius).


Anda dapat membiasakan diri dengan daftar instruksi terperinci, menyentuh ikon yang ditempatkan di sudut atas layar. Pada saat yang sama, semua tim harus mulai dengan banding "Jarvis" dan biasanya berisi satu kata (misalnya, "Jarvis, Prakiraan Cuaca"). Jarvis juga tahu bagaimana memberi tahu pemilik perangkat pertemuan di masa depan dan menampilkan waktu saat ini. Berbagai nama audio dapat dibuat dalam program.

Penting untuk dicatat bahwa pemilik disk optik dengan blok film "Iron Man" Utilitas Jarvis menyediakan fitur tambahan. Misalnya, pengguna dapat dengan mudah mengelola pemutaran film yang sesuai menggunakan Butler Virtual ini.


Informasi bermanfaat: Jika Anda mengajukan pertanyaan asisten virtual Anda: Apakah perlu membeli BMW 740 (http://www.bmw-avtoport.ru/auto/7/), maka jawabannya dengan probabilitas seratus persen akan afirmatif! By the way, Anda dapat membeli BMW Seventh Series sekarang pada kondisi yang paling menguntungkan untuk diri sendiri! Yang perlu Anda lakukan untuk ini adalah mengunjungi situs web www.bmw-avtoport.ru.

Hari ini kita akan berbicara tentang pidato kita. Saya ingin Anda mengendarai suara komputer, Tanpa bantuan ujung jari Anda? Dan, seperti yang mereka katakan, - kekuatan pemikiran! Benar, kita tidak akan mengelola komputer dengan kekuatan pemikiran, tetapi ini sangat realistis.

Program Topan - Ini adalah salah satu program terbaik untuk mengelola komputer melalui suara. Di situs-situs dalam komentar untuk program ini, pendapat konversi.

Benar ada kekurangan Anda. Tetapi lebih lanjut tentang itu nanti. By the way, jika Anda tertarik - baca ulasan saya.

Anda dapat mengunduh program di sini: http://freesoft.ru/typle

Bagaimana cara menggunakannya? Pada awalnya, luncurkan dan lihat tombol kontrol utama:

Program ini menyambut kami dan segera memberi kami petunjuk cara menggunakan WASTLE. Pada awalnya, klik tombol Tambah dan tulis kata, seperti "Open". Untuk melakukan ini, ucapkan kata ini ke dalam mikrofon:

Lalu klik Tambah. Jadi, kami telah menyimpan kata "buka" dalam program ini. Anda dapat berbicara dalam mikrofon dengan kata lain. Yang utama bukan untuk bingung.

Langkah selanjutnya akan menambahkan perintah. Untuk melakukan ini, mari kita pergi ke titik ini:

Kemudian kami menetapkan kutu di seberang item yang kami butuhkan:

Pilih program, aplikasi atau tindakan dan klik tombol Rekor Merah. Jika komputer mempersepsikan suara kami, klik "Tambah":

Dan sekarang akan terlihat di profil kami tim suara. DI kasus ini Yang membuka 7-zip:

Dan sekarang dengan mengklik tombol final "Mulai bicara"

kami berbicara frasa "buka Semen Zip". Dalam kasus saya, semuanya akan berhasil. Dan program 7-Zip akan terbuka. Ingat frasa seperti itu: SIM SIM terbuka? Ini adalah sesuatu yang kira-kira sama.

Program ini tidak selalu berfungsi secara memadai. Sekarang bahasa Rusia yang perkasa tidak sepenuhnya dipelajari oleh programmer linguistik ... tetapi masih bagus ketika komputer mendengarkan Anda.

Oleh karena itu, untuk pengujian dan rasa ingin tahu dangkal, program ketik akan sesuai dengan 100%.

Dalam video ini, Anda dapat melihat sejarah penciptaan mesin suara pertama dan apa lagi yang harus kita kerjakan:

Ada nama-nama mengerikan dari analog lain dari program ini, seperti Gorynych, Perpetuum, Dotograph, Komandan Suara. Tetapi mereka semua "bukan itu." Jangan mengkritik program yang layak.

Saya pergi selama 5 menit untuk menguasai program ini. Ini cukup lama (terutama dalam program seperti itu saya mengerti 1-2 menit). Jika pertanyaan muncul - tulis. Sampai segera bertemu, teman-teman :)!


Untuk waktu yang lama saya tidak meninggalkan ide "jarvis" saya dan manajemen teknik di House of Voice. Dan akhirnya, tangan mencapai penciptaan keajaiban ini. Saya tidak perlu memikirkan "otak" untuk waktu yang lama, Raspberry Pi cocok.

Jadi besi:

  • Raspberry Pi 3 Model B
  • USB Logitech Camera.

Penjualan

Asisten kami akan bekerja pada prinsip Alexa / Hub:
  1. Aktifkan offline pada kata tertentu
  2. Kenali perintah di cloud
  3. Jalankan perintah
  4. Laporkan melakukan pekerjaan atau informasikan informasi permintaan
Karena Kamera saya didukung dari kotak, Anda tidak perlu main-main dengan driver, jadi kami segera pergi ke bagian program.

Aktivasi offline.

Aktivasi akan terjadi dengan CMU sphinx, dan semuanya akan baik-baik saja, tetapi pengakuannya sangat lambat dari kotak, lebih dari 10 detik, yang sama sekali tidak cocok, untuk menyelesaikan masalah yang Anda butuhkan untuk menghapus kamus dari kata-kata yang tidak perlu.

Instal semua yang Anda butuhkan:

Pip3 Instal SpechRecognition Pip3 Instal Pocketsphinx
Lebih lanjut

Sudo nano /usr/local/lib/python3.4/dist-packages/speed_recognition/pocketsphinx-data/en-pronounciation.dict
Kami menghapus semuanya kecuali Jarvis yang kami butuhkan:

Jarvis jh aa r v ah s
Sekarang pocketsphinx mengakui cukup cepat.

Pengenalan suara

Pada awalnya ada ide untuk menggunakan layanan Google, dan dukungannya dalam pengakuan obrolan. Tetapi ternyata, Google mengambil uang untuk ini dan tidak bekerja dengan Phys. Orang-orang.

Manfaat Yandex juga memberikan kesempatan seperti itu, gratis dan sangat sederhana.

Kami mendaftar, kami mendapatkan API kunci. Semua pekerjaan bisa menjadi kurus.

Curl -x Post -H "tipe konten: audio / x-wav" --data-binary "@file" "https://asr.yandex.net/asr_xml?uuid\u003dyf_api_key&topic\u003dQueries»

Sintesis pidato

Di sini Yandex akan membantu kita lagi. Kami mengirim teks sebagai respons untuk mendapatkan file dengan teks yang disintesis.

Curl "https://tts.voictech.yandex.net/menate?format\u003dwav&lang\u003dru-ru&speaker\u003dgood&motion\u003dgood&key\u003dya_api_Key" Teks \u003d teks "\u003e

Jarvis.

Kami mengumpulkan semuanya dan mendapatkan skrip seperti itu.

! / Usr / bin / env python # - * - coding: utf-8 - * - impor os impor pidato_recognition sebagai sr dari xml.dom impor minidom impor sys import acak r \u003d sr.recognizer \u003d "" Ya_UUID \u003d "" # Os.system ("echo" assist + ut zap + kota "| festival --tts - lesuages \u200b\u200benglish") def convert_ya_asr_to_key (): xmldoc \u003d minidom.parse ("./ asr_answer.xml") itemlist ("Varian") jika len (itemlist)\u003e 0: mengembalikan itemlist.firstchild.nodeValue lain: mengembalikan false def jarvis_on (): dengan sr.wavfile ("kirim.wav") sebagai sumber: audio \u003d r.record (sumber) Coba: t \u003d r.recognize_sphinx (audio) cetak (audio) kecuali lookuperror: cetak ("tidak bisa mengerti audio") mengembalikan t \u003d\u003d ("jarvis") def jarvis_say (frase): os.system ("Curl" https: //tts.voictech.yandex.net/generate?format\u003dwav&lang\u003dru-rub&speaker&motion\u003dgood&key \u003d "" -g --data-urlencode "text \u003d" + frase + "system "\u003e jarvis_speech.wav) ("ALLAY JARVIS_SPECH.WAV") DEF JARVIS_SAY_GOOD (): Frase \u003d ["Siap", "Selesai", "Dengar "," Memiliki "," sesuatu yang lain? ",] Randitem \u003d acak 16000 -d 3 -d plughw: 1.0 kirim.wav ") jika jarvis_on (): OS.System (" ALLAY JARVIS_ON.WAV ") OS.System (" Arecord -b --Buffer-Time \u003d 1000000 - F DAT -R 16000 -d 3 -d Plughw: 1.0 Send.WAV ") OS.System (" Curl -x Post -H "Tipe Konten: Audio / X-WAV" --data-biner "" https: //asr.yandex.net/asr_xml?uuid\u003d"+ya_uuid + "k + ya_uuid +" & tombol \u003d "k + ya_api_key +" & topic \u003d queries "\u003e asr_answer.xml") command_aSr_to_key () if (command_key): jika ( command_key di ['key_word ",' kunci_word1 ',' key_word2"]): os.system ('') jarvis_say_good () Lanjutkan kecuali pengecualian: jarvis_say ("sesuatu yang salah")
Apa yang terjadi di sini. Jalankan loop tak terbatas, arecord'om menulis tiga detik dan mengirim sphinx ke pengakuan jika kata "jarvis" ditemukan dalam file

Jika jarvis_on ():
Kami kehilangan di muka file peringatan aktivasi yang direkam.

Kami kembali menulis 3 detik dan mengirim Yandex, saya mendapatkan tim kami sebagai tanggapan. Selanjutnya, lakukan tindakan berdasarkan perintah.

Tentang ini sebenarnya semuanya. Skenario kinerja dapat menghasilkan set yang hebat.

Gunakan-case.

Sekarang beberapa contoh penggunaan nyata

Philips Hue.

Install

Pip instal phue.
Dalam aplikasi Hue, instal IP statis:

Lari:

#! / usr / bin / python impor sys dari phue impor jembatan b \u003d jembatan ("192.168.0.100") # masukkan IP jembatan di sini. #Jika berjalan untuk pertama kalinya, tekan tombol pada jembatan dan jalankan dengan B.Connect () tidak sesuai # b.Connect () cetak (b.get_scene ())
Kami menulis id dari skema yang diinginkan, formulir "470D4C3C8-on-0"

Versi akhir dari skrip:

#! / usr / bin / python impor sys dari phue impor jembatan b \u003d jembatan ("192.168.0.100") # masukkan IP jembatan di sini. #Jika berjalan untuk pertama kalinya, tekan tombol pada jembatan dan jalankan dengan B.Connect () tidak sesuai # B.Connect () jika (sys.argv \u003d\u003d "off"): b.set_light (, "pada", salah) Lain: B.Activate_Scene (1, sys.argv)
Tambahkan ke Jarvis:

Jika (command_key dalam ["cahaya", "nyalakan cahaya", "cahaya"]): os.system ("python3 /home/pi/smarthome/hue/hue/hue.py a1167aa91-on-0") jarvis_say_good () Jika (command_key dalam ["cahaya", "bisu cahaya"]): os.system ("python3 /home/pi/smartthome/hue/hue.py ac637e2f0-on-0") jarvis_say_good () Lanjutkan jika (command_key di [ "Matikan lampu", "matikan lampu"]): os.system ("python3 /home/pi/smartthome/hue/hue.py" off ") jarvis_say_good () Lanjutkan

LG TV.

Kami mengambil skrip dari sini. Setelah awal pertama dan memasuki kode konjugasi, kode itu sendiri tidak berubah, sehingga Anda dapat memotong bagian ini dari skrip dan hanya menyisakan kontrol.

Tambahkan ke Jarvis:

# 1 - POWER # 24 - VOLUNE_UP # 25 - Volume_down # 400 - 3D_Video IF (Command_Key di ["TWC TWC", "Matikan TV"]: OS.System ("Python3 / Home / Pi / Smarthome / TV / Tv2. Py 1 ") jarvis_say_good () Lanjutkan jika (command_key di ['add volume", "lfertom"]): os.system ("python3 /home/pi/smartthome/tv/tv2.py 24") Jarvis_Say_Good () Terus

Radio

Sudo apt-get install mpg123
Tambahkan ke Jarvis:

Jika (Command_key di [Berita ", 'Matikan Berita', 'Apa yang Terjadi']): OS.System ('MPG123 URL) Lanjutkan
Anda masih dapat menempatkan homebridge dan mengelola semuanya melalui Siri, jika Anda tidak menyelesaikan Jarvis.

Adapun kualitas pengenalan ucapan, bukan Alexa tentu saja, tetapi pada jarak 5 meter persentase dari bahan-bahan yang setia. Masalah utama adalah pidato dari TV \\ speaker direkam dengan perintah dan mengganggu pengakuan.

Itu saja, terima kasih.

Tag:

  • raspberry Pi.
  • python.
Tambahkan tanda