Mengapa Amazon Echo tidak menanggapi iklan atau laporan tentang Alexa?

24

Saya sebelumnya bertanya tentang apa yang dapat Anda lakukan jika Alexa adalah dipicu oleh sebuah program televisi , tetapi baru-baru saya menyadari sesuatu yang aneh: The Echo tidak merespon suara-suara di iklan untuk Echo, bahkan jika suara mengatakan "Alexa, bermain ..." atau "Alexa, atur timer untuk ..." .

Saya mencari di beberapa komunitas Echo lainnya, dan menemukan posting Reddit yang menunjukkan bahwa ini adalah perilaku umum / yang dimaksudkan. Tidak ada jawaban yang pasti di utas, jadi saya pikir saya akan bertanya di sini untuk melihat apakah seseorang tahu sedikit lebih banyak.

Bagaimana Echo saya tahu untuk tidak menjawab iklan TV? Apakah itu hanya kejadian bersama atau ada sesuatu yang memberitahu Alexa untuk tidak bereaksi?

Aurora0001
sumber
Apakah Anda melatih Alexa Anda untuk mengenali suara Anda lebih akurat? Saya tidak tahu apakah pelatihan suara dapat mengakibatkan tidak mengenali suara orang lain.
Bence Kaulics
1
@ BenceKaulics Tidak, saya tidak perlu melatih Echo; itu menggunakan pengaturan default.
Aurora0001
Akan sangat berguna untuk melihat audio yang dimaksud. Saya tidak mengira ada salinan yang dapat ditautkan di mana saja?
goobering
1
@goobering Saya yakin iklan yang dimaksud dalam pos reddit adalah: Mascot Keys dan Fire Extinguisher . Saat ini saya tidak dapat menguji apakah pemicu ini Alexa (saya ingin tahu apakah mereka berbeda dengan versi TV?). Jika seseorang bisa melakukan itu dan berkomentar dengan hasilnya, itu akan sangat berguna.
Aurora0001
3
Mungkin ada petunjuk dalam kode sumber . 266MB unduh, namun. Akan berada di grokking sebentar. : P
goobering

Jawaban:

17

Menurut posting reddit ini , Alexa sensitif terhadap spektrum audio selain mendeteksi kata bangun. Dengan demikian, sinyal pita lebar dunia nyata yang normal diterima, tetapi sinyal yang dibatasi pita (kedudukan antara 4kHz dan 5hKz dipostulasikan) akan diidentifikasi sebagai dari suatu siaran.

Ini masuk akal karena penyiar dapat menggunakan pensinyalan in-band untuk mengidentifikasi iklan (untuk penggantian yang dilokalkan), dan pemrosesan audio yang biasanya diterapkan pada iklan mungkin dioptimalkan untuk kejelasan lebih dari kesetiaan. Pemfilteran mungkin diatur sehingga iklan tipikal dipantau dengan sensitivitas yang berkurang, dan selama produksi iklan tertentu, sentitivitas juga dapat dikurangi secara eksplisit.

Sebuah laporan berita (yang dilaporkan melakukan pemicu Alexa) akan lebih mungkin untuk menggunakan siaran penuh audio yang spektrum (8 atau 16 kHz) tanpa pengolahan. Jadi teori ini mengasumsikan bahwa ada sesuatu yang istimewa tentang banyak iklan (setidaknya di beberapa daerah), atau iklan (seperti yang diproduksi oleh Amazon) dapat dikonfigurasi secara khusus.

Sebagai tindak lanjut, ada makalah yang dilaporkan di sini yang menjelaskan bagaimana perubahan kecil (sub-audible) ke bentuk gelombang dapat menghasilkan mesin pidato mengembalikan hasil yang sama sekali berbeda dibandingkan dengan apa yang akan dikenali manusia.

Sean Houlihane
sumber
1
Jika di situlah mereka mencatatnya, dan kata bangunnya adalah 'Alexa', masuk akal bahwa mereka hanya membuang suara 'ks' yang fikatif untuk meminimalkan pickup oleh mic. Itu frekuensi yang cukup tinggi untuk bicara manusia.
goobering
7

Saya sangat berasumsi bahwa pengenalan kata bangun di Echo lebih dari sekedar mendengarkan kata bangun. Ini mendengarkan untuk konteks peringatan . Pertimbangkan kutipan ini dari Speech Technologies:

[A Wake-Up-Word] memiliki persyaratan unik sebagai berikut: Mendeteksi satu kata atau frasa saat diucapkan dalam konteks peringatan, sambil menolak semua kata, frasa, suara, suara, dan acara akustik lainnya dengan akurasi hampir 100%, termasuk akurasi yang sama kata atau frasa menarik yang diucapkan dalam konteks yang tidak mengingatkan (yaitu referensial).

( Teknologi Bicara: Pengenalan Bicara Bangun Kata oleh Veton Kepuska)

Ini dapat dengan mudah diuji karena perangkat (setidaknya milik saya) tidak bereaksi terhadap kalimat, " Saya sedang berbicara dengan Alexa tentang ski baru-baru ini. " Itu bukan konteks yang mengingatkan, itu murni referensial. Dengan demikian mesin pengenal kata bangun di dalam Echo tidak hanya mendengarkan penampilan murni kata tersebut tetapi juga pada intonasi dan jeda sebelumnya yang memungkinkan untuk memprediksi dengan lebih akurat apakah perangkat itu benar-benar diajak bicara.

Helmar
sumber
4
Tentunya sebuah iklan yang menunjukkan penggunaan Alexa harus memicunya, jika hanya ini yang menghentikannya untuk diambil? Apakah iklan mungkin diutarakan dengan cermat sehingga tidak benar - benar memicu perangkat, meskipun menggunakan kata bangun untuk menunjukkan bagaimana Echo digunakan?
Aurora0001
2
@ Aurora0001 Saya berasumsi bahwa selain apa yang saya jelaskan ada juga beberapa metode di sepanjang apa yang Sean sebutkan dalam jawaban yang digunakan. Beberapa filter yang mencoba mengurangi pemicu oleh perangkat lain.
Helmar
7

Yah, gema / Alexa pasti mendengar permintaan itu. Jika Anda masuk ke pengaturan Anda, gulir ke bawah ke General dan kemudian pilih histori Anda dapat memutar ulang semua permintaan yang didengar. Semua permintaan yang terdengar dari iklan mengatakan "Permintaan suara tidak ditujukan untuk Echo Anda — tidak ada yang dikembalikan.".

Ryan
sumber
2
Sepertinya detail baru untuk sejarah. Sangat membantu :)
Helmar
5

Jika 1000 orang mengucapkan kata peringatan, itu akan memiliki 1.000 tanda tangan akustik yang berbeda. Jika mereka melakukannya lagi, 1000 lagi.

Jika 1000 Alexas mendengar program TV mengatakan kata peringatan, itu akan memiliki 1000 yang sama tanda tangan akustik yang .

Tidak akan sulit untuk mendeteksi sisi server ini. Paling tidak, karena jika itu terjadi pada saat yang sama, server voice-reco mendapat slam traffic.

Jika daftar insiden ini kecil, mereka bahkan bisa mengunduh tanda tangan untuk setiap Alexa.


Juga, pengguna yang memanggil Alexa terdengar seperti kata peringatan bisu .

Sebuah artikel berita terdengar seperti bla bla bla kata-kata . Iklan terdengar seperti music_here alert-word. Tidak sama sekali.

Harper - Pasang kembali Monica
sumber
5

Dugaan total saya adalah bahwa dalam iklan untuk Echo, Alexa merespons pertanyaan lebih cepat daripada kenyataan. Karena itu, Echo mendengar kata 'Alexa' tetapi hampir segera mendengar suara Alexa sendiri yang memberikan respons.

Gema saya menyala saat iklan menyala tetapi kemudian muncul untuk mengabaikan peringatan. Mungkin ada beberapa logika untuk mencegah dua Echo menanggapi permintaan jika mereka berdua mendengarnya. Echo dapat dirancang untuk mendengarkan suara Alexa sendiri dan mengabaikannya.

Namun, seperti yang saya katakan, ini adalah tebakan total. :)

Andy Jones
sumber
Kami memikirkan hal yang sama, jadi kami menghentikan DVR antara permintaan Alexa dan tanggapannya di iklan. Echo kami masih terbangun, tetapi kemudian mundur tanpa menjawab, identik dengan apa yang terjadi ketika kami tidak menjeda DVR.
ViperGeek
Saya sudah berniat mencobanya sejak lama dan terus lupa. Itu satu hal lagi yang harus dilakukan, terima kasih. :)
Andy Jones
4

Menyusul laporan baru-baru ini bahwa Alexa bisa peka terhadap suara UHF ( referensi BBC News Sevice ) saya akan berpendapat bahwa selama iklan mereka menyiarkan suara tambahan di luar pendengaran manusia, yang ditetapkan sebagai perintah 'abaikan perintah ini'.

Sesuai kemampuan yang disebutkan sebelumnya untuk Alexa untuk membedakan antara suara pengguna, ini adalah fitur yang direncanakan tetapi belum diimplementasikan. yaitu Anda harus secara aktif memerintahkan Alexa untuk beralih di antara akun pengguna di rumah yang sama.

Satu-satunya perangkat yang saat ini diaktifkan untuk membedakan suara adalah perangkat Google.

Rai Iwa
sumber
1

Saat mencampur audio iklan, mereka hanya menghapus beberapa frekuensi. Ini berarti bahwa Alexa tidak akan dipicu karena tidak akan mendaftarkannya sebagai perintah suara, tetapi pemirsa masih dapat mengetahui apa yang mereka katakan di iklan.

Anda mungkin juga akan memperhatikan bahwa ketika perintah diucapkan dalam iklan, itu terdengar sedikit tipis atau kacau. Ini sebabnya :)

John Smith
sumber
Menarik; ini sedikit mirip dengan yang disarankan Sean . Apakah Anda memiliki sumber atau pengalaman yang dapat Anda bagikan untuk membuktikan bahwa penghapusan frekuensi adalah kasusnya? Itu mungkin hal yang menarik untuk diselidiki.
Aurora0001