Apakah ada cara untuk mengunduh transkripsi YouTube yang dibuat secara otomatis tanpa mengunduh video?
Saya ingin memeriksa pembicaraan TED, tetapi saya memiliki bandwidth terbatas dan ingin mengekspor transkrip otomatis (juga mungkin dikenal sebagai subtitle atau teks tertutup).
Jawaban:
Gunakan "Jaringan Inspektur" fungsi script debugger browser Anda dan menemukan permintaan kedua untuk timedtext halaman setelah mengaktifkan subtitle ditranskrip kemudian copy semua bahwa permintaan untuk addressbar untuk men-download dalam format xml YouTube asli.
Untuk mendapatkan versi SRT, jalankan kode ini di konsol debugger untuk halaman xml itu:
Juga di sini adalah versi bookmarklet dari skrip:
sumber
Ada beberapa cara untuk mengekstrak subtitle dari video YouTube -
Dengan menentukan bahasa dan VideoId di URL umum ini -
http://www.youtube.com/api/timedtext?lang={LANG}&v={VIDEOID}
Anda bisa mendapatkan.xml
file yang berisi teks terjemahan dalam bahasa yang diinginkan untuk video yang dipilih.Untuk menghilangkan tag di dalam file itu dan hanya memiliki transkrip teks biasa , inilah yang harus Anda lakukan:
Atau, ada alat open-source yang disebut Google2SRT yang mengunduh semua subs yang tersedia dari video YouTube dengan satu klik & mengubahnya menjadi
.srt
format sehingga dapat digunakan dalam pemutar media seperti VLC Media Player.Pembaruan: Ted.com sekarang menyediakan transkrip pembicaraan di situsnya.
sumber
http://video.google.com/timedtext?lang=english&v=b11AXknrsEI
tetapi tidak berhasil. Juga, pergi ke alat pengembang tidak membantu. Ada banyak sumber daya di sana dan tidak satupun dari mereka mengatakan teks waktu.english
keen
daneng
tetapi melakukan hal yang sama.Saya pikir ini skrip pengguna harus bekerja untuk Anda:
http://userscripts.org/scripts/show/50003/
sumber
Google2SRT 0.6 mendukung ASR YouTube: http://sourceforge.net/projects/google2srt/
sumber
Jika itu adalah video Anda sendiri, Anda dapat mengunduh subtitle dari pengelola video. Pergi ke:
Manajer Video >> Edit (pada video yang Anda inginkan) >> Captions >> (Klik pada trek yang ingin Anda unduh) >> Actions (drop down box)
Pada saat penulisan, ada tiga jenis file yang tersedia:
Ini memiliki kegunaan yang berbeda dalam aplikasi yang berbeda, tetapi sangat mirip. SRT mungkin yang paling umum.
Kalau tidak, jika itu bukan video Anda, metode terbaik (hanya metode) adalah untuk mendapatkan file xml dari alat Pengembang.
Menggunakan Google Chrome dalam contoh ini, navigasikan ke video lalu ikuti langkah-langkah ini:
timedtext?
plus banyak variabel. Yang kedua biasanya yang Anda inginkan. Dimulai seperti ini:<transcript> <text start="4.14" dur="3.049">my name is doctor john rush</text> <text start="7.189" dur="3.731">I'm the CEO and president</text>
File xml ini berguna jika Anda ingin menggunakan transkrip di halaman web. Selain itu, saya tidak berpikir Anda bisa menggunakannya dengan cara yang sama seperti Anda menggunakan file SRT. Jika Anda pandai pemrograman, Anda dapat dengan mudah menulis sebuah program yang akan mengubahnya menjadi SRT. Saya menulis program C # saya sendiri yang mengekstraksi data untuk tujuan yang berbeda dan butuh waktu kurang dari dua jam.
sumber