Apple начала использовать данные с устройств пользователей для улучшения своих ИИ-сервисов, в частности системы Apple Intelligence. Однако компания уверяет, что применяет уникальный подход, гарантирующий сохранность личных данных.
Как сообщает Apple, в основе нового метода лежит технология дифференциальной конфиденциальности. Сначала создаются синтетические данные — искусственно сгенерированные тексты, которые имитируют реальные письма и сообщения по стилю и содержанию, но не копируют их напрямую. Эти данные преобразуются в числовые представления — встраивания (embeddings), содержащие информацию о языке, теме и длине текста.
Далее Apple выбирает небольшую выборку устройств, владельцы которых согласились участвовать в программе аналитики. Им отправляются эти синтетические встраивания. Устройства сравнивают их с последними письмами пользователя и определяют, какие из искусственных данных наиболее близки к реальным. Это помогает компании оценить точность моделей и при необходимости корректировать их — без передачи самих писем или личных сообщений.
Apple подчеркивает, что не собирает тексты писем или сообщений, не связывает данные с IP-адресами или учетными записями пользователей. Видит она только часто используемые запросы, без возможности идентификации отправителя.
Новый подход будет применяться не только для улучшения функции суммирования писем, но и в таких продуктах, как Genmoji, Image Playground, Image Wand, Memories Creation, Writing Tools и Visual Intelligence. Внедрение системы начнется с бета-версий iOS и iPadOS 18.5, а также macOS 15.5.
Хотя Apple продолжает позиционировать себя как защитника конфиденциальности, эффективность её моделей ИИ может уступать конкурентам, которые используют более агрессивные методы сбора данных.