MP3 audiostream checksum

программы mp3 утилиты CRC checksum

(Прошу прощения, не сумел сформулировать заглавие по-русски адекватно.)

Подскажите, пожалуйста, если кто знает, программу, способную считать чексуммы (любые: CRC, MD5, etc.) *аудиопотока* MP3-файла. Т.е. необходимо, чтобы полученное число *не* зависело ни от какой незвуковой информации в MP3-файле (любые теги, мусор, оставляемый кодером и другими программами, желательно и ReplayGain...). Довольно-таки безразлично, как выглядит программа: консольная утилита, win32 GUI приложение или исходники.

Ну или в самом крайнем случае может кто подскажет, как написать самому...
Ответы:
Напишите сами такую утилитку. Начните с формата mp3 [1], что/где/как лежит в битовом потоке. Потом в DirectSound [2], в примеры и документацию. Потом уже сможете и сами выложить вашу утилитку в Веб :)
DeadShot, DirectSound-то мне зачем? Мне ж не плеер писать. :-) И вообще, это только на крайняк. Не хочу велосипед изобретать. Наверняка уже кто-то писал. ( И зажилил]:-> ) Мне попадалась какая-то прога, которая считает CRC, якобы, без учёта тегов, но на самом деле там какой-то конкретный тип тегов не учитывается, а всякий другой хлам влияет. Мне же надо, чтобы файлы считались идентичными, если идентичны wav-вайлы, полученные декодированием обоих (одним и тем же кодеком).
19.11.2007 7:59:17 PureVirtual
mp3 - lossy сжатие, даже wav-файлы полученные одной и той программой могут отличатся, а mp3 файлы тем более.
> даже wav-файлы полученные одной и той программой могут отличатся, а mp3 файлы тем более
Я почти уверен, что уже давно написана программа для Linux, автоматизирующая работу со всеми существующими тегами. Это, по-моему, очень банальная задача, которая требуется многим людям.
Юрий, об объёмах я писал. Около 150 гигабайт. Мне не нужны "промышленные масштабы", фактически стоит утилитарная задача найти дубли в существующей коллекции и быстро определять наличие в ней копий новых файлов.
Я говорю, что копии всех файлов не нужны. Если ты точно знаешь, что теги могут находиться где попало и меняют размер файла, то самый простой вариант сравнивать попарно файлы с примерно одинаковым размером и именами (ключевыми словами, учитывать транслит), если совпадают больше чем на 60-70%, то файлы можно считать одинаковыми.
Как насчёт последовательного удаления разных тегов разными программами? Тоже довольно лёгкий в реализации вариант, опять-таки в конвейере.
Наконец возможно из самый медленный, требовательный к ОЗУ (необязательно), но зато наиболее правильный и честный вариант: декодировать wav (возможно в ОЗУ), посчитать сумму, удалить (освободить память).
Почему замолчал, забросил или уже получилось?
>мегабайт
конечно же гигабайт, редактирования страшно не хватает((
<offtopic>Юрий, гиперактивность развёл, аж пипец. =)</offtopic>


17 лет назад

RPI.su - самая большая русскоязычная база вопросов и ответов. Наш проект был реализован как продолжение популярного сервиса otvety.google.ru, который был закрыт и удален 30 апреля 2015 года. Мы решили воскресить полезный сервис Ответы Гугл, чтобы любой человек смог публично узнать ответ на свой вопрос у интернет сообщества.

Все вопросы, добавленные на сайт ответов Google, мы скопировали и сохранили здесь. Имена старых пользователей также отображены в том виде, в котором они существовали ранее. Только нужно заново пройти регистрацию, чтобы иметь возможность задавать вопросы, или отвечать другим.

Чтобы связаться с нами по любому вопросу О САЙТЕ (реклама, сотрудничество, отзыв о сервисе), пишите на почту [email protected]. Только все общие вопросы размещайте на сайте, на них ответ по почте не предоставляется.