ИИ начал чувствовать нехватку данных, ограничения ужесточаются
MIT под руководством Data Provenance Initiative провели исследование и выяснили, что многие ключевые веб-источники стали ограничивать использование своих данных, это плохо влияет на обучение мощных систем.
MIT под руководством Data Provenance Initiative провели исследование и выяснили, что многие ключевые веб-источники стали ограничивать использование своих данных, это плохо влияет на обучение мощных систем.
➡️ Проанализировано 14000 доменов, которые используются в трех основных наборах данных для обучения ИИ. По результатам — был обнаружен значительный зарождающийся кризис согласия.
Известно, что за год примерно 5% всех данных и 25% данных самого высокого качества ограничиваются протоколом исключения роботов — этот инструмент владельцы сайтов используют для блокировки автоматических сборщиков данных.