Статьи и тексты о машинном обучении
Статьи и тексты о машинном обучении
Здесь представлены статьи, и блоги о данных и машинном обучении в производственной среде.
Не знаете, как реализовать свой проект с машинным обучением? Узнайте, как это удалось другим компаниям:
- Как сформулирована проблема (например, персонализация в виде recsys, поиска и последовательностей)
- Какие методы машинного обучения сработали (а какие нет)
- Почему это работает? Наука в основе исследований, литература и ссылки
- Какие реальные результаты достигнуты (чтобы вы могли лучше оценить рентабельность инвестиций)
P.S. Хотите краткий обзор достижений машинного обучения? ml-опросы
P.P.S. Ищете руководства и интервью по применению ML? applyingML
Содержание
- Качество данных
- Инженерия данных
- Обнаружение данных
- Магазины функций
- Классификация
- Регресс
- Прогнозирование
- Рекомендации
- Поиск и рейтинг
- Вложения
- Обработка естественного языка
- Последовательное моделирование
- Компьютерное зрение
- Обучение с подкреплением
- Обнаружение аномалий
- График
- Оптимизация
- Выделение информации
- Слабый надзор
- Поколение
- Аудио
- Валидация и A/B-тестированием
- Управление моделью
- Эффективность
- Этика
- Платформы MLOps
- Практики
- Структура команды
- Неудачи
Качество данных
- Мониторинг качества данных в масштабе с помощью статистического моделирования Uber
- Подход к качеству данных для систем персонализации Netflix Netflix
- Автоматизация крупномасштабной проверки качества данных (статья) Amazon
- Знакомьтесь, Hodor – Инструмент качества данных разведки и добычи Gojek Gojek
- Надежный и масштабируемый прием данных на Airbnb Airbnb
- Проблемы управления данными в производственном машинном обучении (статья) Google
- Повышение точности путем достоверной оценки человеческих решений, ярлыков и оценщиков (статья) Facebook
Инженерия данных
- Zipline: платформа управления данными для машинного обучения Airbnb Airbnb
- Sputnik: фреймворк Apache Spark для инженерии данных Airbnb Airbnb
- Разделение рабочих процессов Data Science с помощью Metaflow и функций AWS Step Netflix
- Как DoorDash масштабирует свою платформу данных, чтобы удовлетворить клиентов и растущий спрос DoorDash
- Масштабная революция в движении денег с надежной согласованностью данных Uber
- Zipline – платформа для разработки декларативных функций Airbnb
- Инфраструктура данных в реальном времени в Uber Uber
Обнаружение данных
- Amundsen — движок Lyft по обнаружению данных и метаданных Lyft
- Открытый исходный код Amundsen: платформа для обнаружения данных и метаданных (код) Lyft
- Amundsen: Год спустя Lyft
- Использование Amundsen для обеспечения конфиденциальности пользователей с помощью сбора метаданных на Square Square
- Обнаружение и использование данных аналитики в Twitter Twitter
- Демократизация данных на Airbnb Airbnb
- Databook: превращение больших данных в знания с помощью метаданных в Uber Uber
- Превращение метаданных в аналитическую информацию с помощью Databook Uber
- Metacat: обеспечение доступности и значимости больших данных в Netflix (код) Netflix
- Изучение данных @ Netflix Netflix
- DataHub: универсальный инструмент поиска и обнаружения метаданных (код) LinkedIn
- DataHub: популярные архитектуры метаданных LinkedIn
- Как мы улучшили обнаружение данных для специалистов по данным в Spotify Spotify
- Как мы решаем проблемы обнаружения данных в Shopify Shopify
- Nemo: открытие данных в Facebook Facebook
- Атлас Apache: управление данными и структура метаданных для Hadoop (код) Apache
- Сбор, агрегирование и визуализация метаданных (кода) экосистемы данных (Code) WeWork
- Изучение данных в Netflix (код) Netflix
Магазины функций
- Представляем Feast: магазин функций с открытым исходным кодом для машинного обучения (код) Gojek
- Праздник: объединение моделей машинного обучения и данных Gojek
- Создание масштабируемого хранилища функций машинного обучения с помощью Redis, двоичной сериализации и сжатия DoorDash
- Building Riviera: декларативный фреймворк для разработки функций в реальном времени DoorDash
- Michelangelo Palette: платформа для разработки функций в Uber Uber
- Оптимальное обнаружение функций: более совершенные и экономичные модели машинного обучения на базе теории информации Uber
- Распределенные путешествия во времени для создания новых функций Netflix
- Магазин фактов в масштабе для рекомендаций Netflix Netflix
- Архитектура магазина функций Twitter Twitter
- Построение графика активности, часть 2 (раздел хранилища функций) LinkedIn
- Быстрое экспериментирование через стандартизацию: типизированные функции ИИ для ленты LinkedIn LinkedIn
- Ускорение машинного обучения с помощью службы хранилища функций Condé Nast
- Создание магазина функций Monzo Bank
- Zipline: платформа управления данными машинного обучения Airbnb Airbnb
- Инфраструктура обслуживания функций машинного обучения в Lyft Lyft
- Butterfree: фреймворк на основе Spark для создания магазина функций (код) QuintoAndar
Классификация
- Высокоточная классификация документов на основе фраз в современном масштабе (статья) LinkedIn
- Chimera: крупномасштабная классификация с использованием машинного обучения, правил и краудсорсинга (статья) WalmartLabs
- Глубокое обучение: категоризация продуктов и полки Walmart
- Масштабная категоризация товаров для электронной коммерции (статья) DianPing, eBay
- Масштабная категоризация товаров в электронной коммерции с использованием множественных рекуррентных нейронных сетей (статья) NAVER
- Категоризация продуктов в масштабе Shopify
- Обучение диагностике с помощью рекуррентных нейронных сетей LSTM (статья) Google
- Выявление и классификация намерений сообщений в приложении на Airbnb Airbnb
- Как мы создали хорошую функцию «Первые выпуски» GitHub
- Обучение машин сортировке ошибок Firefox Mozilla
- Более эффективное тестирование Firefox с помощью машинного обучения Mozilla
- Использование машинного обучения для пациентов, получающих цифровые психиатрические вмешательства (статья) Microsoft
- Прогнозирование оттока рекламодателей для Google AdWords (Статья) Google
- Масштабируемая классификация данных для обеспечения безопасности и конфиденциальности (статья) Facebook
- Раскрытие передовых методов работы с меню доставки в Интернете с помощью машинного обучения DoorDash
- Использование Human-in-the-Loop для решения проблемы холодного запуска в пункте меню с тегом DoorDash
Регресс
- Использование машинного обучения для прогнозирования стоимости домов на Airbnb Airbnb
- Использование машинного обучения для прогнозирования ценности рекламных запросов Twitter
- Открытый исходный код Riskquant, библиотека для количественной оценки риска (код) NetFlix
- Решение для ненаблюдаемых данных в модели регрессии с помощью простой корректировки данных DoorDash
Прогнозирование
- Прогнозирование в Uber: введение Uber
- Инженерное прогнозирование экстремальных событий в Uber с RNN Uber
- Преобразование финансового прогнозирования с помощью науки о данных и машинного обучения в Uber Uber
- Под капотом автоматизированного инструмента прогнозирования Gojek GoJek
- BusTr: прогнозирование времени в пути на автобусе на основе данных о трафике в реальном времени (статья, видео) Google
- Переобучение моделей машинного обучения после COVID-19 DoorDash
- Управление балансом спроса и предложения с помощью машинного обучения DoorDash
- Автоматическое прогнозирование с использованием Prophet, Databricks, Delta Lake и MLflow (статья и код) Atlassian
- Greykite: гибкая, интуитивно понятная и быстрая библиотека прогнозов LinkedIn
Рекомендации
- Рекомендации Amazon.com: совместная фильтрация товаров (статья) Amazon Amazon
- Темпорально-контекстная рекомендация в реальном времени (статья) Amazon
- P-Companion: основа для рекомендаций по диверсифицированным дополнительным продуктам (статья) Amazon
- Рекомендации дополнительных товаров в push-уведомлениях электронной торговли (статья) Alibaba
- Глубокий интерес к сети иерархического внимания для прогнозирования рейтинга кликов (статья) Alibaba
- Преобразователь последовательности поведения для рекомендаций по электронной коммерции в Alibaba (статья) Alibaba
- TPG-DNN: метод прогнозирования намерений пользователя с многозадачным обучением (статья) Alibaba
- PURS: персонализированная система неожиданных рекомендаций для повышения удовлетворенности пользователей (статья) Alibaba
- SDM: модель последовательного глубокого сопоставления для крупномасштабной онлайн-рекомендательной системы (статья) Alibaba
- Многопользовательская сеть с динамической маршрутизацией для рекомендаций в Tmall (статья) Alibaba
- Контролируемая многосторонняя структура для рекомендаций (статья) Alibaba
- MiNet: сеть со смешанным интересом для междоменного прогнозирования кликабельности (статья) Alibaba
- ATBRG: Сеть реляционного графа адаптивного поведения цели для эффективных рекомендаций (статья) Alibaba
- Сессионные рекомендации с рекуррентными нейронными сетями (статья) Telefonica
- Как 20th Century Fox использует машинное обучение для прогнозирования аудитории фильма (статья) 20th Century Fox
- Глубокие нейронные сети для YouTube. Рекомендации YouTube
- Персональные рекомендации для впечатлений от использования глубокого обучения TripAdvisor
- Электронная коммерция в вашем почтовом ящике: рекомендации по продуктам в масштабе Yahoo
- Масштабные рекомендации по продуктам (статья) Yahoo
- На основе ИИ: система рекомендаций Instagram Explore Facebook
- Рекомендации Netflix: за пределами пяти звезд (часть 1 (часть 2) Netflix
- Изучение персонализированной домашней страницы Netflix
- Персонализация художественных работ в Netflix Netflix
- Продолжение следует: Помогаем вам находить шоу для продолжения просмотра на Netflix Netflix
- Калиброванные рекомендации (статья) Netflix
- Отбор образцов задней части для Slate Bandits (статья) Netflix
- Доставка еды с Uber Eats: рекомендации для торговой площадки Uber
- Доставка еды с Uber Eats: использование графического обучения для поддержки рекомендаций Uber
- Как работает музыкальная рекомендация, и как не работает Spotify
- Музыкальные рекомендации в Spotify Spotify
- Как рекомендовать музыку на Spotify с помощью глубокого обучени Spotify
- Только для ушей: персонализация Spotify Home с помощью машинного обучения Spotify
- Достигнуть вершины: как Spotify создал ярлыки всего за шесть месяцев Spotify
- Исследуй, эксплуатируй и объясняй: персонализация объяснимых рекомендаций с помощью Bandits (статья) Spotify
- Контекстные и последовательные пользовательские вложения для крупномасштабных музыкальных рекомендаций (статья) Spotify
- Эволюция комплекта: автоматизация маркетинга с помощью машинного обучения Shopify
- Использование машинного обучения, чтобы предсказать, какой файл вам нужен будет дальше (часть 1) Dropbox
- Использование машинного обучения, чтобы предсказать, какой файл вам нужен будет дальше (часть 2) Dropbox
- Персональные рекомендации в LinkedIn Learning LinkedIn
- Более пристальный взгляд на ИИ. Рекомендации по обучению в LinkedIn (часть 1) LinkedIn
- Более пристальный взгляд на ИИ. Рекомендации по обучению в LinkedIn (часть 2) LinkedIn
- Научиться быть актуальным: эволюция системы рекомендаций по курсу LinkedIn
- Создание неоднородной системы рекомендаций социальных сетей LinkedIn
- Как TikTok рекомендует видео #ForYou ByteDance
- Метаобучение рекомендаций холодного старта для товаров (статья) Twitter
- Извлеченные уроки преодоления предвзятости набора данных при генерации кандидатов на основе моделей (статья) Twitter
- Нулевой гетерогенный перенос обучения от RecSys к поисковому поиску с холодным запуском (статья) Google
- Улучшенная глубокая и кросс-сеть для перекрестного обучения функций в веб-системах LTR (статья) Google
- Самоконтролируемое обучение для рекомендаций по крупномасштабным предметам (статья) Google
- Смешанная отрицательная выборка для изучения двухбашенных нейронных сетей в рекомендациях (статья) Google
- Персонализированные рекомендации каналов в Slack Slack
- Deep Retrieval: сквозная обучаемая модель структуры для крупномасштабных рекомендаций (статья) ByteDance
- Данные будущего помогают обучению: моделирование будущих контекстов для рекомендаций на основе сеансов (статья) Tencent
- Использование ИИ для помощи экспертам в области здравоохранения в борьбе с пандемией COVID-19 Facebook
- Практический пример рекомендаций на основе сеансов в сфере улучшения домашнего быта (статья) Home Depot
- Уравновешивание актуальности и открытия для вдохновения клиентов в приложении IKEA (статья) Ikea
- Pixie: система для рекомендации 3+ миллиардов товаров 200+ миллионам пользователей в реальном времени (статья) Pinterest
- Как мы используем AutoML, многозадачное обучение и модели с несколькими башнями для Pinterest Ads Pinterest Pinterest
- Многозадачное обучение для рекомендаций по сопутствующим товарам в Pinterest Pinterest
- Повышение качества рекомендуемых пинов с помощью облегченного ранжирования Pinterest Pinterest
- Системы рекомендаций рекламодателей в Pinterest Pinterest
- Персонализированный фильтр кухни, основанный на предпочтениях клиентов и местной популярности DoorDash
- Как мы создали алгоритм поиска партнеров для перекрестных продаж продуктов Gojek
Поиск и рейтинг
- Amazon Search: радость ранжирования продуктов (статья, видео, код) Amazon
- Почему люди покупают, казалось бы, нерелевантные товары в голосовом поиске продуктов? (статья) Amazon
- Семантический поиск продуктов (статья) Amazon
- QUEEN: переписывание нейронных запросов в электронной коммерции (статья) Amazon
- Как Lazada ранжирует продукты для улучшения качества обслуживания клиентов и повышения конверсии Lazada
- Масштабное использование глубокого обучения в хронике Twitter Twitter
- Поисковый рейтинг Airbnb на основе машинного обучения Airbnb
- Применение глубокого обучения к поиску Airbnb (статья) Airbnb
- Управление разнообразием в поиске Airbnb (статья) Airbnb
- Улучшение глубокого обучения для поиска Airbnb (статья) Airbnb
- Рейтинг релевантности в поиске Yahoo (статья) Yahoo
- Ансамблевой подход к прогнозированию CTR для продвигаемых листингов на Etsy (статья) Etsy
- Обучение ранжированию результатов персонализированного поиска в профессиональных сетях (статья) LinkedIn
- Модели персонализированного поиска талантов с функциями древовидного взаимодействия (статья) LinkedIn
- Персонализация во время сеанса для поиска талантов (статья) LinkedIn
- Искусственный интеллект в системе поиска и рекомендаций рекрутеров LinkedIn LinkedIn
- Изучение предпочтений при приеме на работу: ИИ, который стоит за вакансиями в LinkedIn LinkedIn
- Соответствие качества с помощью персонализированного ИИ для предпочтений нанимателей и соискателей LinkedIn
- Понимание времени ожидания для улучшения рейтинга каналов LinkedIn LinkedIn
- Размещение рекламы в ленте с помощью ограниченной оптимизации (статья, видео) LinkedIn
- Системы поиска и рекомендации талантов в LinkedIn (статья) LinkedIn
- Понимание времени ожидания для улучшения рейтинга каналов LinkedIn LinkedIn
- ИИ в масштабе в Bing Microsoft
- Механизм понимания запросов в Traveloka. Универсальный поиск Traveloka
- Секрет персонализации поиска GoJek
- Доставка еды с Uber Eats: создание механизма понимания запросов Uber
- Поиск нейронного кода: поиск кода на основе машинного обучения с использованием запросов на естественном языке Facebook
- Байесовский рейтинг продуктов на Wayfair Wayfair
- COLD: На пути к следующему поколению системы предварительного ранжирования (статья) Alibaba
- Оптимизированный на глобальном уровне рейтинг взаимного влияния в поиске в электронной коммерции (статья) Alibaba
- Graph Intention Network для прогнозирования CTR в спонсируемом поиске (статья) Alibaba
- Обучение с подкреплением для ранжирования в поисковой системе электронной коммерции (статья) Alibaba
- Агрегирование результатов поиска из разнородных источников с помощью обучения с подкреплением (статья) Alibaba
- Междоменная сеть внимания с регуляторами Вассерштейна для поиска в сфере электронной торговли Alibaba
- Понимание поиска лучше, чем когда-либо прежде (статья) Google
- Shop The Look: создание крупномасштабной системы визуальных покупок в Pinterest (статья, видео) Pinterest
- Повышение продаж на Pinterest. Поиск Pinterest
- GDMix: платформа персонализации для глубокого ранжирования (код) LinkedIn
- Персонализированный поиск на Etsy Etsy
- Создание более совершенной поисковой системы для исследователей семантики Allen Institute for AI
- Анализ запросов для корпоративного поиска на естественном языке (статья) Salesforce
- Как мы использовали семантический поиск, чтобы сделать наш поиск в 10 раз умнее Tokopedia
- Поддержка поиска и рекомендаций в DoorDash DoorDash
- Вещи, а не строки: понимание намерений поиска с помощью DoorDash, способного лучше вспоминать DoorDash
- Понимание запроса для поиска недостаточно обслуживаемого музыкального контента (статья) Spotify
- Как мы создали контекстно-зависимую систему ставок для Etsy Ads Etsy
- Query2vec: расширение поискового запроса с встраиванием запросов GrubHub
- Поиск на основе встраивания в поиске в Facebook (статья) Facebook
- На пути к персонализированному и семантическому поиску для поиска в сфере электронной коммерции посредством встраивания обучения (статья) JD
- MOBIUS: на пути к следующему поколению сопоставления запросов и объявлений в спонсируемом поиске Baidu Baidu
- Ранжирование на основе предварительно обученной языковой модели в поисковой системе Baidu (статья) Baidu
Вложения
- Рекомендации по внедрению товаров в миллиардном масштабе для сферы электронной коммерции в Alibaba (статья) Alibaba
- Вложения в Twitter Twitter
- Размещение встраиваемых материалов в поисковом рейтинге (статья) Airbnb
- Понимание скрытого стиля Stitch Fix
- На пути к глубокому и репрезентативному обучению для поиска талантов в LinkedIn (статья) LinkedIn
- Стоит ли встраивать? Исследование производительности встраиваний для рекомендаций в реальном времени (статья) Moshbit
- Векторное представление товаров, покупателя и тележки для построения системы рекомендаций (статья) Sears
- Машинное обучение для лучшего опыта разработчиков Netflix
- Представляем ScaNN: эффективный поиск по сходству векторов (статья, код) Google
- Персонализированная лента магазинов с векторными вложениями DoorDash
- Получение на основе встраивания в Scribd Scribd
Обработка естественного языка
- Обнаружение ненормативной лексики в пользовательском онлайн-контенте (статья) Yahoo
- Как обработка естественного языка помогает участникам LinkedIn легко получать поддержку LinkedIn
- Создание умных ответов на сообщения участников LinkedIn
- DeText: глубокая структура НЛП для интеллектуального понимания текста (код) LinkedIn
- Умный ответ: автоматический ответ для электронной почты (статья) Google
- Gmail Smart Compose: написание в реальном времени (статья) Google
- SmartReply для авторов YouTube Google
- Использование нейронных сетей для поиска ответов в таблицах (статья) Google
- Масштабируемый подход к снижению гендерных предубеждений в Google Translate Google
- Вспомогательный ИИ упрощает ответы Microsoft
- ИИ продвигается к лучшему распознаванию языка ненависти Facebook
- Современный чат-бот с открытым исходным кодом (статья) Facebook
- Высокоэффективная система преобразования текста в речь в реальном времени, развернутая на процессорах Facebook
- Глубокое обучение для перевода между языками программирования (статья, код) Facebook
- Развертывание обучения на основе диалога в открытом диалоге на протяжении всей жизни (статья) Facebook
- Представляем Dynabench: переосмысление методов тестирования ИИ Facebook
- Dynaboard: переход от точности к целостной оценке моделей в НЛП (Код) Facebook
- Целенаправленные сквозные разговорные модели с функциями профиля в реальных условиях (Статья) Amazon
- Как Gojek использует НЛП, чтобы назвать места выдачи заказов в Scale GoJek
- Дайте мне джинсы, а не обувь: как BERT помогает нам делать то, что хотят клиенты Stitch Fix
- Современный чат-бот с открытым доменом на китайском и английском языках (статья) Baidu
- PEGASUS: современная модель обобщения абстрактного текста (статья, код) Google
- Photon: надежная междоменная система преобразования текста в SQL (статья) (демо) Salesforce
- GeDi: новый мощный метод управления языковыми моделями (статья, код) Salesforce
- Применение тематического моделирования для улучшения работы операторского центра RICOH
- WIDeText: мультимодальная структура глубокого обучения Airbnb
- Dynaboard: переход от точности к оценке целостной модели в НЛП Facebook
- Как мы сократили время выполнения схожести текста на 99,96% Microsoft
Последовательное моделирование
- Практика моделирования длительного последовательного поведения пользователей для прогнозирования кликабельности (статья) Alibaba
- Моделирование интереса пользователей на основе поиска с последовательными данными о поведении для прогнозирования CTR (статья) Alibaba
- Глубокое обучение для электронных медицинских карт (статья) Google
- Глубокое обучение для понимания истории потребителей (статья) Zalando
- Непрерывное прогнозирование посещаемости уведомлений в классических и глубоких сетях (статья) Telefonica
- Использование моделей рекуррентных нейронных сетей для раннего обнаружения сердечной недостаточности (статья) Sutter Health
- Doctor AI: Прогнозирование клинических событий с помощью рекуррентных нейронных сетей (статья) Sutter Health
- Как Duolingo использует ИИ во всех частях своего приложения Duolingo
- Использование социальных взаимодействий в Интернете для повышения честности в Facebook (статья, видео) Facebook
Компьютерное зрение
- Категоризация фотографий объявлений на Airbnb Airbnb
- Обнаружение удобств и не только – новые рубежи компьютерного зрения в Airbnb Airbnb
- На основе искусственного интеллекта: улучшение понимания продукта и создание новых возможностей для покупок Facebook
- Новое исследование искусственного интеллекта, помогающее прогнозировать потребности в ресурсах COVID-19 с помощью рентгеновских лучей (статья, модель) Facebook
- Создание современного конвейера OCR с использованием компьютерного зрения и Deep Learning Dropbox
- Как мы улучшили показатели компьютерного зрения более чем на 5% только за счет устранения ошибок маркировки Deepomatic
- Нейронная модель погоды для восьмичасового прогнозирования осадков (статья) Google
- Оценка ущерба на основе машинного обучения для оказания помощи при стихийных бедствиях (статья) Google
- RepNet: Подсчет повторов в видео (статья) Google
- Преобразование текста в изображения для обнаружения продуктов (статья) Amazon
- Как Disney использует PyTorch для распознавания анимированных персонажей Disney
- Создание подписей к изображениям как вспомогательная технология (видео) IBM
- AI для AG: производственное машинное обучение для сельского хозяйства Blue River
- ИИ для автономного вождения Tesla
- Распознавание продуктов в супермаркетах на устройстве Google
- Использование машинного обучения для определения недостаточного охвата при обследовании колоноскопии (статья) Google
- Shop The Look: создание крупномасштабной системы визуальных покупок в Pinterest (статья, видео) Pinterest
- Разработка в реальном времени автоматического определения языка жестов для видеоконференцсвязи (статья) Google
- Ориентированное на видение ценовое предложение на подержанные товары в Интернете (статья) Alibaba
- Как заставить машины распознавать и расшифровывать разговоры на собраниях с помощью аудио и видео Microsoft
- Эффективный подход к обучению распознаванию лиц в очень больших масштабах (статья) Alibaba
- Определение типов документов в Scribd Scribd
Обучение с подкреплением
- Глубокое обучение с подкреплением для размещения ставок в режиме реального времени через спонсируемый поиск (статья) Alibaba
- Динамическое ценообразование на платформе электронной коммерции с глубоким обучением с подкреплением (статья) Alibaba
- Торги с ограничениями по бюджету с помощью обучения с подкреплением без использования моделей в медийной рекламе (статья) Alibaba
- Глубокое обучение с подкреплением с помощью Spark и MLflow Zynga
- Глубокое обучение с подкреплением в производстве, часть 1, часть 2 Zynga
- Создание торговых систем искусственного интеллекта Denny Britz
- Обучение с подкреплением для логистики по требованию DoorDash
- Обучение с подкреплением для ранжирования в поисковой системе электронной коммерции (статья) Alibaba
Обнаружение аномалий
- Обнаружение аномалий производительности при развертывании внешнего микропрограммного обеспечения Netflix
- Выявление и предотвращение злоупотреблений в LinkedIn с помощью Isolation Forests (код) LinkedIn
- Предотвращение злоупотреблений с помощью неконтролируемого обучения LinkedIn
- Технологии борьбы с домогательствами в LinkedIn LinkedIn
- Раскрытие заговора о страховом мошенничестве с помощью сетевого обучения (статья) Ant Financial
- Как работает защита от спама в Stack Exchange? Stack Exchange
- Автоматическая модерация контента в электронной коммерции C2C Mercari
- Блокирование приглашающего спама в Slack с помощью машинного обучения Slack
- Cloudflare Bot Management: машинное обучение и многое другое Cloudflare
- Аномалии колебаний температуры масла в туннельном бурильном станке SENER
- Использование обнаружения аномалий для мониторинга клиентов банка с низким уровнем риска Rabobank
- Борьба с мошенничеством с Triplet Loss OLX Group
- Facebook теперь использует ИИ для сортировки контента для более быстрой модерации (альтернатива) Facebook
- Как ИИ лучше распознает разжигание ненависти Ч. 1, Ч. 2, Ч. 3, Ч. 4 Facebook
- Обнаружение глубоких аномалий с помощью Spark и Tensorflow (видео Hopsworks (Swedbank, Hopsworks
График
- Создание сети знаний LinkedIn LinkedIn
- График розничной торговли – сеть знаний о продуктах Walmart Walmart
- Доставка еды с Uber Eats: использование графического обучения для поддержки рекомендаций Uber
- AliGraph: платформа комплексной графической нейронной сети (статья) Alibaba
- Расширение доступа к знаниям и их извлечения на Airbnb Airbnb
- Контекстуализация Airbnb с помощью построения сети знаний Airbnb
- Прогнозирование трафика с помощью расширенных графических нейронных сетей DeepMind
- SimClusters: рекомендации сообщества в отношении рекомендаций (статья, видео) Twitter
- Агрегированная сеть соседей, управляемая метапутами, для анализа неоднородных графов (статья) Alibaba
- Сеть Graph Intention Network для прогнозирования CTR в спонсируемом поиске (статья) Alibaba
- JEL: Применение сквозного связывания нейронных сущностей в JPMorgan Chase (статья) JPMorgan Chase
- Сверточные нейронные сети с графами для рекомендательных систем веб-масштаба (Статья) Pinterest
Оптимизация
- Как выводы о поездках и машинное обучение оптимизируют время доставки в Uber Uber
- Оптимизация следующего поколения для рассылки Dasher в DoorDash DoorDash
- Подбор игроков в Lyft Line (Часть 1) (Часть 2) (Часть 3) Lyft
- Данные и наука, лежащие в основе совместного использования GrabShare Grab
- Оптимизация времени ожидания пассажиров в лифтах с помощью машинного обучения Thyssen Krupp AG
- Подумайте о пакете: рекомендуемые типы пакетов для отправок в сфере электронной коммерции (статья) Amazon
- Оптимизация маркетинговых расходов DoorDash с помощью машинного обучения DoorDash
Извлечение информации
- Неконтролируемое извлечение атрибутов и их значений из описания продукта (статья) Rakuten
- Извлечение информации из чеков с помощью графных сверточных сетей Nanonets
- Использование машинного обучения для индексации текста из миллиардов изображений Dropbox
- Извлечение структурированных данных из шаблонных документов (статья) Google
- AutoKnow: самостоятельный сбор знаний о продуктах тысяч типов (статья, видео) Amazon
- Однократная маркировка текста с использованием внимания и распространения убеждений для извлечения информации (статья) Alibaba
Слабый контроль
- Snorkel DryBell: пример внедрения слабого надзора в промышленных масштабах (статья) Google
- Osprey: слабое наблюдение за проблемами несбалансированного извлечения без кода (статья) Intel
- Overton: система данных для мониторинга и улучшения продуктов с машинным обучением (статья) Apple
- Настройка переговорных агентов со слабым контролем (статья) IBM
Поколение
- Лучшие языковые модели и их значение (статья) OpenAI
- Языковые модели – немногие изучающие (статья) (пост в блоге GPT-3) OpenAI
- Изображение GPT (статья, код) OpenAI
- Высокообученное сверхвысокое разрешение для производства художественных фильмов (статья) Pixar
- Генерация модульных тестов с помощью трансформаторов Microsoft
Аудио
- Улучшение распознавания речи на устройстве с помощью VoiceFilter-Lite (статья) Google
- Машинное обучение при поиске Google
Валидация и A/B-тестирование
- Многоразовая задержка: сохранение достоверности адаптивного анализа данных (статья) Google
- Эксперименты в Twitter: технический обзор Twitter
- Экспериментируйте, чтобы побороть зубрежку Twitter
- Создание интеллектуальной платформы для экспериментов с Uber Engineering Uber
- Анализ результатов экспериментов: эффекты лечения, выходящие за рамки среднего Uber
- Под капотом экспериментальной платформы Uber Uber
- Объявление о новой платформе для разработки оптимальных экспериментов с Pyro (статья) Uber
- Возможность в 10 раз больше с экспериментальной платформой Traveloka Traveloka
- Крупномасштабные эксперименты с исправлением стежка (статья) Stitch Fix
- Многорукие бандиты и экспериментальная платформа Stitch Fix Stitch Fix
- Эксперименты с исправлением стежка ограничения ресурсов Stitch Fix
- Лучшее моделирование коэффициентов конверсии и сбережения миллионов с использованием распределений Каплана-Мейера и гамма-распределения (код) Better
- Это все о A/В тестировании: экспериментальная платформа Netflix Netflix
- Вычислительная причинно-следственная связь в Netflix (статья) Netflix
- Ключевые проблемы с квазиэкспериментами в Netflix Netflix
- Ограниченная байесовская оптимизация с шумными экспериментами (статья) Facebook
- Обнаружение помех: A/B-тест или A/B-тесты LinkedIn
- Как сделать экспериментальную машину LinkedIn в 20 раз быстрее LinkedIn
- Наша эволюция в сторону T-REX: предыстория экспериментальной инфраструктуры в LinkedIn LinkedIn
- Как использовать квазиэксперименты и контрфактические методы для создания отличных продуктов Shopify
- Повышение экспериментальной мощности за счет управления с использованием прогнозов в виде ковариантов Doordash
- Поддержка быстрого изменения продукта с помощью платформы экспериментального анализа DoorDash
- Увеличение количества онлайн-экспериментов в 4 раза за счет распараллеливания и повышения чувствительности DoorDash
- Использование причинно-следственного моделирования для получения большей отдачи от плоских результатов эксперимента DoorDash
- Итерация алгоритмов назначения в реальном времени с помощью экспериментов DoorDash
- Проведение экспериментов с Google Adwords для оптимизации кампании DoorDash
- Новая экспериментальная платформа Spotify (Часть 1) (Часть 2) Spotify
- Перекрывающаяся экспериментальная инфраструктура: больше, лучше, быстрее экспериментируйте (статья) Google
- Экспериментальная платформа в Zalando: Часть 1 - Эволюция Zalando
- Масштабирование экспериментальной платформы Airbnb Airbnb
- Проектирование ограждений для экспериментов Airbnb
- Надежные и масштабируемые переключатели функций и SDK для A/B-тестирования в Grab Grab
- Васаби, платформа для A/B-тестирования с открытым исходным кодом (код) Intuit
- Создание платформы для A/B-тестирования Pinterest Pinterest
Управление моделью
- Взлетно-посадочная полоса – управление жизненным циклом модели в Netflix Netflix
- Overton: система данных для мониторинга и улучшения продуктов с машинным обучением (статья) Apple
- Управление моделями машинного обучения в масштабе – платформа Intuit для машинного обучения Intuit
- Внедрение машинного обучения – управление происхождением от исходных данных до прогнозов Comcast
- Мониторинг модели ML – 9 советов из окопов Nubank
Эффективность
- GrokNet: магистраль унифицированной модели компьютерного зрения и встраивания для сферы электронной коммерции (статья) Facebook
- Перестановка, квантование и точная настройка: эффективное сжатие нейронных сетей (статья) Uber
- Как мы масштабировали Bert для обслуживания более 1 миллиарда ежедневных запросов на процессорах Roblox
Этика
- Создание инклюзивных продуктов с помощью A/B-тестирования (статья) LinkedIn
- LiFT: масштабируемая структура для измерения справедливости в приложениях машинного обучения (статья) LinkedIn
Инфра
- Реинжиниринг платформ глубокого обучения Facebook AI для взаимодействия Facebook
- Эластичное распределенное обучение с XGBoost на Ray Uber
Платформы MLOps
- Управление моделями машинного обучения в масштабе – платформа машинного обучения Intuit Intuit
- Внедрение машинного обучения – управление происхождением от необработанных данных до прогнозов Comcast
- Платформа машинного обучения больших данных в Pinterest Pinterest
- Платформа вывода машинного обучения в реальном времени в Zomato Zomato
- Знакомьтесь, Микеланджело: платформа машинного обучения Uber Uber
- Построение гибких ансамблевых моделей машинного обучения с помощью вычислительного графа DoorDash
- LyftLearn: инфраструктура обучения модели машинного обучения, построенная на Kubernetes Lyft
- «Вам не нужна большая лодка»: полный конвейер данных, созданный с помощью инструментов с открытым исходным кодом (статья) Coveo
- Базовое моделирование в Instagram Instagram
- Открытый исходный код Metaflow – ориентированная на человека структура для науки о данных Netflix
Практики
- Практические рекомендации по градиентному обучению глубинным архитектурам (статья) Yoshua Bengio
- Машинное обучение: кредитная карта с высоким процентом технического долга (статья) Google
- Правила машинного обучения: лучшие практики машинного обучения Google
- О проблемах управления моделями машинного обучения Amazon
- Машинное обучение в производстве: подход Booking.com Booking
- 150 успешных моделей машинного обучения: 6 уроков, извлеченных на Booking.com (статья) Booking
- Успехи и проблемы масштабного внедрения машинного обучения в глобальном банке Rabobank
- Проблемы при развертывании машинного обучения: обзор конкретных примеров (статья) Cambridge
- Непрерывная интеграция и развертывание для онлайн-обслуживания машинного обучения и моделей Uber
- Настройка производительности модели Uber
- Реинжиниринг платформ глубокого обучения Facebook AI для взаимодействия Facebook
- Проблема с инструментами разработки ИИ для компаний Databricks
- Поддержание точности модели машинного обучения с помощью мониторинга DoorDash
- Создание масштабируемых и эффективных маркетинговых систем машинного обучения в Wayfair Wayfair
Структура команды
- Инженерам не следует писать ETL: руководство по созданию высокофункционального исправления ошибок в отделе обработки и анализа данных Stitch Fix
- Остерегайтесь фабрики выводов Data Science: мощь универсального исправления Full-Stack Data Stitch Fix
- Развитие алгоритмов: как мы развиваем науку о данных в Stitch Fix StitchFix
- Аналитика в Netflix: кто мы и чем занимаемся Netflix
Неудачи
- 160k + старшеклассников закончат обучение только в том случае, если модель позволит им International Baccalaureate
- Когда дело доходит до горилл, Google Фото остается слепым Google
- Алгоритм, который «предсказывает» преступность на основе лица, вызывает ярость Harrisburg University
- Сложно создать нейронный текст из GPT-3 о мусульманах OpenAI
- Британский инструмент искусственного интеллекта для прогнозирования насильственных преступлений слишком несовершенен для использования United Kingdom
- Больше о awful-ai
P.S. Хотите краткий обзор достижений машинного обучения? Будьте в курсе дел с нашими обзорами ml-опросы