Beberapa sumber berita seperti Intellihub dan CEPro tampaknya menyarankan bahwa rumah asisten Echo Amazon terus-menerus mendengarkan percakapan dan mengirimkannya melalui internet ke server Amazon. CEPro menyatakan bahwa:
Dengan mengucapkan frasa kunci, Amazon menyebut "kata bangun", Echo menjadi hidup dan mulai mendengarkan perintah. Secara default, kata bangun adalah Alexa.
Jika Anda membaca ulang kalimat terakhir itu mungkin tidak masuk akal, terutama jika Anda berada di bidang keamanan. Menurut Amazon, Echo hanya mendengarkan perintah setelah mendengar kata bangunnya. Bagaimana ia tahu ketika Anda mengucapkan kata bangun jika belum mendengarkan?
Artikel Intellihub serupa dalam sentimennya:
Perangkat "Amazon Echo", speaker Bluetooth yang terus-menerus mendengarkan yang terhubung ke layanan streaming musik seperti Pandora dan Spotify dengan suara seseorang, dapat dengan mudah diretas dan digunakan oleh lembaga pemerintah seperti FBI untuk mendengarkan percakapan.
(Perhatikan bahwa saya tidak terlalu terfokus pada eksplorasi aspek hacking pertanyaan ini, karena itu mungkin akan terlalu banyak untuk satu pertanyaan. Fokus utama saya adalah selalu-on aspek dan apakah ini mengirimkan data sepanjang waktu .)
Tidak ada artikel yang tampak tertarik untuk mengungkapkan sumber untuk klaimnya, yang menunjukkan kepada saya bahwa mereka tidak terbukti terbaik, atau clickbait paling buruk.
Apakah Echo selalu merekam dan mengirim data ke cloud, atau apakah klaim di atas tidak terbukti? Bagaimana cara Amazon Echo memproses data jika tidak selalu mengirim data ke server di cloud?
sumber
Tidak pada pengiriman. Tapi ya di rekaman.
Saat ini saya sedang mengembangkan klien perangkat keras Alexa untuk sebuah perusahaan. Perangkat selalu mendengarkan. Tetapi Anda harus memasukkan wake engine di atasnya sehingga "bangun" dari mode mendengarkan pasif dan beralih ke mode "mendengarkan perintah" yang aktif.
Firmware hanya akan mengirim pernyataan setelah kata bangun (beralih ke mode aktif) ke cloud untuk memprosesnya sebagai perintah.
Dalam mode pasif, perangkat memiliki mesin kata bangun internal yang mendengarkan sepanjang waktu untuk kata bangun. Sementara saya menguji Alexa di Raspberry Pi, saya harus memasukkan mesin Sensory atau KITT.AI untuk tujuan ini. Bahkan, ketika saya mencoba prototipe kode klien Alexa untuk mesin Linux saya, itu harus "push-to-talk" karena tidak ada kata bangun mesin.
sumber
Echo mendengarkan kata kunci secara aktif dan mengambil kata-kata yang diucapkan setelah kata kunci untuk pemrosesan NLU. Inilah pemahaman saya bagaimana gema mencapai prestasi yang rapi ini.
Echo dibangun di atas Texas Instruments DM3725 Digital Media Processor.
SoC TI ini memiliki dua buah kunci di dalam, pertama adalah ARM Cortex-A8 MPU, dan yang kedua adalah TMS320DM64x + DSP. Inti ARM harus menjalankan Linux dan DSP menjalankan firmware.
Saat idle, inti ARM dibawa ke status daya serendah mungkin dan Linux sepenuhnya ditangguhkan. Pada saat ini, On-Chip RAM DSP dan 64KB sedang aktif. Firmware DSP memproses derau yang datang dari mikrofon dan berupaya mengidentifikasi apakah kata kunci (mis., Alexa) diucapkan. Begitu mengidentifikasi ada kata kunci, DSP mengirimkan interupsi untuk membangunkan inti ARM yang pada gilirannya melanjutkan Linux. Tapi, ingat, ketika Linux membangunkan manusia yang mengatakan Alexa akan terus berbicara (seperti, "Alexa, jam berapa sekarang?" ). DSP mendukung "jam berapa sekarang?" bagian pada RAM on chip. Dan ketika Linux dilanjutkan, Linux mengambil pidato buffered dan menggunakan kemampuan Natural Language Processing (sebagian lokal, sebagian cloud) untuk memahami apa yang dikatakan Manusia.
Seperti yang Anda lihat, desain benar-benar dibuat menjadi yang paling haus daya dan untuk menghindari keharusan menyertakan cloud untuk deteksi kata kunci dan buffering awal. Sebagai soal menjaga inti ARM pada kondisi daya terendah memastikan bahwa silikon memanas paling sedikit saat idling sehingga dengan cara membawa umur panjang ke perangkat Anda.
Saya meninggalkan diskusi tentang upaya meretas gema karena pertanyaannya berikut:
sumber
Iya nih.
Lihat, misalnya, Seberapa pribadi Amazon Echo yang baru? (Ada banyak lagi yang serupa ditemukan dengan usaha minimal)
Namun,
sumber