subtitles (27.9.2006, 13:39) писал:
1. предупредить читателя , что за сильно ужатые (типа МПЕГ-4) или сильно зашумлённые фильмы стоит браться только тогда, когда нет другого выхода (а-ля скачать их из инета) - буквы по всему фильму будут сильно отличаться и OCR-процесс может очень затянуться.
2. перед тем как начинать выдирать сабы из того или иного фильма стоит убедиться, что фильм действительно hardsubbed и порекомендовать софт, который позволит демуксить текстовые сабы из различных контейнеров (mkv, mp4, avi, etc.)
3. Наконец, мелкая поправка уже по сути статьи... перед OCR, SubRip создаёт AVS-скрипт, где грузит фильм через команду DirectShowSource. Метод универсальный, но по опыту знаю, что очень глючный с точки зрения таймирования. Ну и к тому же, fps для ntsc фильмов не 29.97 и 23.976, а соответственно 30000/1001 и 24000/1001. Поправка невелика, но на длинных фильмах может привести к определённой рассинхронизации: чтобы этого её не было, достаточно дополнить скрипт командой типа assumefps(clip,24000,1001). Ну, или подкорректировать синхренизацию выдранных сабов в ВоркПопе...
4. И немного удивила фраза о том, что AviSynth аллокирует кадры между i-фреймами. Если исходить из общих соображений, то декодированием занимается кодек и DShow, a следовательно AviSinthу скармливается уже расжатое YV12-видео. Откуда ему, AviSynthу знать где предыдущий и последующий i-фреймы. Думаю, что он аллокирует столько кадров сколько на него выделено памяти (SetMemoryMax). Xoтя деталей я не знаю, но могу порыться в доках...
ПС. Как любят выражаться официальные оппоненты, всё вышеизложенное не умаляет достоинств и тд и тп. Говоря по-русски, спасибо за работу...