pozitronik (
pozitronik) wrote2010-02-24 05:15 pm
![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Entry tags:
Про музыку-2
На этой неделе должен, обязан просто, завершить предварительную сортировку музыкальных завалов. Херня осталась, гигов сто лосслеса, это работы часа на три.
Что входит в сортировку?
- Разбор музыки по альбомам. Я много лет придумывал способы удобного хранения музыки на винте. Оставить всё в неразобранной кучке не могу, потому как только не группировал: и по годам выпуска, и по исполнителю, и по тому, нравится, или нет. В общем-то, весь этот труд группировки должен брать на себя проигрыватель, но музыкальные плееры со всеми своими крутыми медиабиблиотеками, с этой задачей справляются крайне хреново. В итоге, идеальный способ был найден: альбомы хранятся в каталогах с названиями вида [год] Исполнитель - Название (Количество дисков) с некоторыми незначительными отступлениями в частных случаях. Всё. Остальное делает Total Commander; быстрый фильтр позволяет найти любой альбом моментально, любая произвольная перегруппировка делается за десять секунд с помощью символических ссылок и мультиренейма. Идеально.
- Разрезание в cuesplitter релизов, идущих в одном файле. Цельные рипы хороши для "восстановления" оригинального диска; для коллекции на цифровом носителе всяко удобнее потрековая разбивка.
Процесс разрезания, кстати, занимает больше всего времени. Найти все релизы, для которых есть cue, запустить для каждого процесс разрезания, ждать, ждать, ждать, проверить корректность разбивки, удалить исходные файлы. Хорошо хоть, что для всех форматов, кроме wv, в разрезанные треки сразу же прописываются теги из cue, потом меньше работы (если, конечно, cue был корректен).
- Прописывание имён и тегов в определённом формате. Эта привычка появилась после того, как в древние-древние времена на огромном десятигиговом винте побилась FAT32, и после восстановления все файлики - в том числе и mp3 - превратились в набор мусора с именами вроде $$$~11.###. Где теги были - восстановил, где не было - пришлось убить, а это горе: интернета не было, музыку доставали через флоппинет с соответствующими скоростями. FAT уже исчез, в десять гигов не влезет и сотая часть моей коллекции, а привычка осталась.
В деле прописывания тегов мне здорово помогает тулза Tag&Rename. Сколько я за свою жизнь редакторов тегов испробовал - не сосчитать. Хотя и в нём есть к чему придраться, он лучший из существующих: умеет корректно вытаскивать теги из имени файла и наоборот, работает с онлайн-базами, пишет обложки.
- Выискивание одинаковых альбомов. Бывает так, что скачанные из разных мест альбомы называются по разному. Ну какая, нафиг, разница для надмозга с местечкового трекера, как обозвать исполнителя: Jean-Michel Jarre, Jean Michele Jarre или J. M. Jarr?
Вручную выловить такие факи почти нереально. Потому написал утилиту, которая сравнивает название каждого альбома со всеми остальными и подсчитывает релевантность сравнения. Самые релевантные результаты проверяются вручную, и уже до хрена копий было таким образом отловлено.
Недостаток утилиты - очень медленная работа. Список на 5000 альбомов проверяется где-то сутки на 3ГГц, и скорость работы увеличивается в геометрической прогрессии, зависящей от размера списка. Распараллелить алгоритм для ускорения работы на многопроцессорных конфигах мне пока не удаётся: быстрее оставить комп включённым, уходя на работу, чем тратить время на доделку. А выкладывать недоделанную утилиту в паблик я не хочу.
Всего у меня набирается музыки где-то на 3Tb (в ознакомительных и пародийных целях, конечно). И я её реально слушаю.
И да, я уже как-то писал точно такой же пост. Самоповтор, бля.
Что входит в сортировку?
- Разбор музыки по альбомам. Я много лет придумывал способы удобного хранения музыки на винте. Оставить всё в неразобранной кучке не могу, потому как только не группировал: и по годам выпуска, и по исполнителю, и по тому, нравится, или нет. В общем-то, весь этот труд группировки должен брать на себя проигрыватель, но музыкальные плееры со всеми своими крутыми медиабиблиотеками, с этой задачей справляются крайне хреново. В итоге, идеальный способ был найден: альбомы хранятся в каталогах с названиями вида [год] Исполнитель - Название (Количество дисков) с некоторыми незначительными отступлениями в частных случаях. Всё. Остальное делает Total Commander; быстрый фильтр позволяет найти любой альбом моментально, любая произвольная перегруппировка делается за десять секунд с помощью символических ссылок и мультиренейма. Идеально.
- Разрезание в cuesplitter релизов, идущих в одном файле. Цельные рипы хороши для "восстановления" оригинального диска; для коллекции на цифровом носителе всяко удобнее потрековая разбивка.
Процесс разрезания, кстати, занимает больше всего времени. Найти все релизы, для которых есть cue, запустить для каждого процесс разрезания, ждать, ждать, ждать, проверить корректность разбивки, удалить исходные файлы. Хорошо хоть, что для всех форматов, кроме wv, в разрезанные треки сразу же прописываются теги из cue, потом меньше работы (если, конечно, cue был корректен).
- Прописывание имён и тегов в определённом формате. Эта привычка появилась после того, как в древние-древние времена на огромном десятигиговом винте побилась FAT32, и после восстановления все файлики - в том числе и mp3 - превратились в набор мусора с именами вроде $$$~11.###. Где теги были - восстановил, где не было - пришлось убить, а это горе: интернета не было, музыку доставали через флоппинет с соответствующими скоростями. FAT уже исчез, в десять гигов не влезет и сотая часть моей коллекции, а привычка осталась.
В деле прописывания тегов мне здорово помогает тулза Tag&Rename. Сколько я за свою жизнь редакторов тегов испробовал - не сосчитать. Хотя и в нём есть к чему придраться, он лучший из существующих: умеет корректно вытаскивать теги из имени файла и наоборот, работает с онлайн-базами, пишет обложки.
- Выискивание одинаковых альбомов. Бывает так, что скачанные из разных мест альбомы называются по разному. Ну какая, нафиг, разница для надмозга с местечкового трекера, как обозвать исполнителя: Jean-Michel Jarre, Jean Michele Jarre или J. M. Jarr?
Вручную выловить такие факи почти нереально. Потому написал утилиту, которая сравнивает название каждого альбома со всеми остальными и подсчитывает релевантность сравнения. Самые релевантные результаты проверяются вручную, и уже до хрена копий было таким образом отловлено.
Недостаток утилиты - очень медленная работа. Список на 5000 альбомов проверяется где-то сутки на 3ГГц, и скорость работы увеличивается в геометрической прогрессии, зависящей от размера списка. Распараллелить алгоритм для ускорения работы на многопроцессорных конфигах мне пока не удаётся: быстрее оставить комп включённым, уходя на работу, чем тратить время на доделку. А выкладывать недоделанную утилиту в паблик я не хочу.
Всего у меня набирается музыки где-то на 3Tb (в ознакомительных и пародийных целях, конечно). И я её реально слушаю.
И да, я уже как-то писал точно такой же пост. Самоповтор, бля.
no subject
А многопоточноздь ты добавь добавь...
no subject
У меня - столько же. Но за раз обрабатывается по сотне альбомов, тут идёт упор в скорость работы винта, который уже на 90% забит.
no subject
А в чём хитрый смысл поименования папочег - я так и не понял. И сортировка по году - мну как то не того что ли. Т.е 1988 год - и там по 1 альбому кучи исполнителей..не айс.
no subject
Я тоже раздавал, пока был инет, счас смысла нет. Появится быстрый нет - ещё чё-нибудь пораздаю, это непринципиально.
>Так что у меня качаецо на один хард, а нарезается - на другой, причем именно хард, не раздел.
Я знал, что после переезда интернетов не будет, и забил винты подзавязку.
>А в чём хитрый смысл поименования папочег - я так и не понял.
А в том, что в названии каталога (нет, бля, папок, есть каталоги!) содержится почти вся идентификационная инфа альбома (ну, кроме стиля, разве что, но я в этом не разбираюсь). В Total Commander при этом очень просто найти любой альбом, равно как и все альбомы одного исполнителя, или, скажем, все альбомы одного исполнителя за год. И сортировка тут никакого значения не имеет, потому как может быть почти произвольной.
>Т.е 1988 год - и там по 1 альбому кучи исполнителей..не айс.
Не, ты не понял. Скриншод: http://www.ljplus.ru/img4/p/o/pozitronik/1.PNG
no subject
no subject
no subject
no subject
(Anonymous) 2013-12-20 08:52 pm (UTC)(link)(Хабр рулит!)
no subject