Пользователям, столкнувшимся с ней, на электронную почту приходит уведомление о том, что один из хранящихся в облаке Google файлов содержит информацию, защищенную копирайтом. Кто именно является правообладателем и чьи интересы были затронуты, сервис не уточняет. Google автоматически накладывает ограничения на такие файлы. В частности, ими нельзя поделиться с другим пользователем, хотя можно загрузить на свой компьютер.
Недоумение получивших такие письма людей вызывает то, что угрозу алгоритмы Google видят в служебном файле macOS, под управлением которой работают компьютеры фирмы Apple, с именем “.DS_Store”. Неприятное удивление может вызывать и отсутствие возможности подать апелляцию на решение, явно вынесенное машиной.
Зачем нужны файлы “.DS_Store”
Файлы “.DS_Store” автоматически генерируются приложением Finder, которое является системным файловым менеджером в операционной системе macOS. Такие файлы содержат атрибуты и метаданные каталогов файловой системы, такие как параметры положения значков или фоновое изображение.
В операционных системах семейства Windows схожее назначение имеют файлы “desktop.ini” (настройки внешнего вида папки) и “thumbs.db” (миниатюры изображений папки для режима «Эскизы страниц» в «Проводнике»).
Как и Windows-аналоги, файлы “.DS_Store” по умолчанию невидны пользователям в «родной» среде. Однако же облачные хранилища, как правило, игнорируют атрибуты и отображают любые файлы, даже если те содержат исключительно служебную информацию.
Виноваты контрольные суммы?
Возможно, все дело в том, что алгоритмы Google, проверяющие загружаемую пользователями информацию на предмет нарушения авторских прав, основывают свои выводы на результатах сверки контрольных сумм (checksums). То есть сравнивают хеш-код пользовательского файла с находящимся в собственной базе данных хеш-кодом файлов, защищенных авторским правом. Совпадение кодов в таком случае является основанием считать, что и содержимое исходных файлов совпадает. Однако хеширование разных исходных данных может давать одинаковый результат в силу специфики алгоритмов хеширования.
Связь с январской проблемой
В январе 2022 г. пользователи Google Drive жаловались на похожую проблему. Тогда сервис помечал как нарушающие авторские права файлы, содержащие лишь единицу («1» – с символом возврата каретки или без него). Примечательно, что подобным же образом, Google реагировал не только на единицу. Доктор Крис Джефферсон (Dr. Chris Jefferson), исследователь из Сент-Эндрюсского университета (Великобритания), написал в своем Twitter, что Drive также невзлюбил числа 173, 174, 186, 266, 285, 302, 336, 451, 500 и 833. Установить какую-либо закономерность между ними ученому не удалось.
Теория контрольных сумм также неплохо объясняет наличие сложностей с воспроизведением ситуации, в которой Google Drive решает отнести файлы типа “.DS_Store” к нарушающим копирайт. Такие файлы, в отличие от несущих в себе короткую последовательность цифр, могут иметь уникальное содержимое, которое зависит от параметров конкретного каталога на конкретном компьютере, поэтому и его хеш с меньшей вероятностью окажется в базе Google.
Сама же Google детальную информацию по данному вопросу предоставлять отказывается. Январская проблема, по информации ИТ-гиганта, решена. Кроме того, были предприняты шаги, направленные на предотвращение ее возникновения в будущем. Тем не менее, представитель компании в разговоре с Bleeping Computer косвенно подтвердил, что пользователи могут сталкиваться с неадекватной реакцией алгоритмов выявления нарушений копирайта в «граничных случаях».
Нажимая кнопку «Подписаться», вы даете свое согласие на обработку и хранение персональных данных.