For faster navigation, this Iframe is preloading the Wikiwand page for Толока (сервис).

Толока (сервис)

Материал из Википедии — свободной энциклопедии

Толока
Изображение логотипа
Тип бизнес
Основание 2014
Основатели Ольга Мегорская
Отрасль интернет
Сайт toloka.ai

Толо́ка (ранее Яндекс Толока) — краудсорсинговый проект, созданный в 2014 году[1] для быстрой разметки большого количества данных, которые затем используются для машинного обучения и совершенствования поисковых алгоритмов[2]. Как правило, размещаемые задания достаточно простые, для их исполнения не требуется специальная подготовка[3]. В основном они связаны с анализом и оценкой контента[4]. Поэтому любой желающий может выполнять задания и получать за них вознаграждение[5].

Названия сервиса

[править | править код]

Толо́ка — это форма деревенской взаимопомощи в России, Украине, Белоруссии, Эстонии, Латвии и Литве. Её организовывали в деревне для выполнения срочных работ, требующих большого количества работников: сбор урожая, вырубка леса, сооружение домов и т. д. Иногда толоку использовали для проведения общественных работ (строительство церквей, школ, дорог и т. п.).

Идея совместной полезной работы на общий результат сочетается с принципом краудсорсинга[6].

Виды заданий и область применения результатов

[править | править код]

Совершенствование поисковых алгоритмов

[править | править код]

Результаты разметки помогают улучшить качество поиска и эффективно настраивать алгоритмы распределения его результатов. Так, в августе 2017-го года Яндекс представил новый поисковый алгоритм «Королёв», при создании которого для обучения нейронных сетей использовались оценки толокеров. За два с лишним года существования сервиса они дали около двух миллиардов оценок, которые позволили разработчикам значительно усовершенствовать свой алгоритм[7].

Развитие машинного обучения

[править | править код]

Чтобы машина поняла, как решать ту или иную задачу, необходимо показать ей огромное количество примеров, как положительных, так и отрицательных[8]. Пользователи сервиса Яндекс Толока в числе других задач могут получать и задания по описанию объектов, определённых компьютером на изображении. Например, на фото помечены объекты, которые смог определить искусственный интеллект, но для применения этих данных в деле требуется точно знать, что это за объекты, чтобы обучить искусственный интеллект по массе таких определений человеком. Который, в свою очередь, получит за такую работу вознаграждение.[2] Кроме того, в Толоке производят проверку автоматически полученных черновиков словарных статей для Яндекс Переводчика.[9]

Аудит и маркетинговые исследования

[править | править код]

Проверка качества работы интернет-магазина, службы доставки, написание отзывов о продуктах и услугах. Например, в 2017 году пользователи Толоки принимали участие в проверке качества работы сервиса возврата товара на Яндекс Маркете. Подобные эксперименты позволяют контролировать качество работы сервиса и выявлять слабые места, над которыми в дальнейшем будет проведена работа по улучшению и устранению выявленных проблем.[10] В другом проекте пользователям предлагалось написать отзыв на товар из популярных категорий и снабдить его собственными фотографиями[11][12].

Выбор дизайна и названий новых продуктов и сервисов

[править | править код]

Ответы на вопросы, связанные с выбором наиболее удачного названия и дизайна для нового продукта или сервиса[13], личными или потребительскими предпочтениями пользователей. В одном из таких опросов толокеры выбирали название для голосового помощника Яндекса[14]. Целью задания было — определить черты характера девушки с тем или иным именем. Для опроса взяли как нужные характеристики так и совсем неподходящие, и стали спрашивать: „Если у девушки вот такое имя, то она скорее добрая или агрессивная?“. С большим отрывом в опросе победило имя «Алиса».[15]

Вознаграждение и вывод средств

[править | править код]

Задания в Толоке оплачиваются — сумма, которую можно заработать, указана рядом с заданием[8]. Для вывода средств можно воспользоваться системами: ЮMoney (Бывшие Яндекс Деньги), PayPal, Qiwi. На этапе отладки процессов со стороны Толоки вывод денег может занимать от нескольких минут до месяца[6].

Мобильные приложения

[править | править код]

Для решения задач, которые требуют работу «в поле» (например, пойти по адресу и проверить актуальность информации об организации), существует мобильная версия Толоки[6]. Сервисом разработаны два приложения — для Android и iOS.

Пользователи

[править | править код]

Пользователи Толоки, или толокeры — люди, которыe за вознаграждeниe выполняют задания по тeстированию и улучшeнию систeмы на краудфандинговой площадкe Яндeкс.Толока[16]. В настоящее время в Толоке около 4 миллионов зарегистрированных пользователей[17] из России, с Украины, из Белоруссии, Казахстана, Узбекистана, Турции, Франции, Индонезии и других стран[18], которые выставили более 2 миллиардов оценок[5]. В 2018 году в проектах в «Толоке» поучаствовало больше миллиона людей[17]. Большинство толокеров — это молодые люди до 35 лет (как правило, студенты технических вузов или мамы в декрете).[6] В основном исполнители рассматривают Толоку в качестве дополнительного источника денег, хотя многие отмечают, что им нравится выполнять полезную работу, делать интернет чище.[6] В 2017 году интернет-холдинг Яндекс наградил 25-лeтнего челябинца Илью Михалeнко за наибольший вклад в совeршeнствованиe поисковой системы.[19] На цeрeмонии запуска нового алгоритма поиска чeлябинцу вручили статуэтку в видe ракeты как символа того, что вводимыe работниками Яндекса инновации сопоставимы с полётами людeй в космос.[1]

Все задания в Толоке размещают Заказчики. Основные направления использования «Толоки» внутри проектов «Яндекса» — это сбор и обработка данных для проектов, связанных с машинным обучением, речевыми технологиями, компьютерным зрением, умными алгоритмами «Поиска» и т. д., модерация контента (разговоры в «Яндекс Картах»), полевые задания (актуализация данных об организациях в «Справочнике»), оптимизация внутренних бизнес-процессов (поиск публикаций в соцсетях, разметка упоминаний Яндекса по тональности на позитивные и негативные). Поскольку над задачей одновременно работают как минимум сотни, а то и тысячи толокеров, результаты готовы в худшем случае на следующий день[2].

Для выявления и изъятия ЛГБТ-книг интернет-издательство Ridero использовало нейросеть, обучавшуюся с помощью «Толоки», чьим пользователям предлагали прочитать текст и указать, одобряется ли в нем «существование лесбиянок, геев, бисексуалов и трансгендеров», смена пола, зоофилия, некрофилия, идеи чайлдфри или инцест. В пресс-службе «Яндекса» сообщили, что отозвали это задание, сочтя его оскорбительным.[20]

Согласно взлому белорусскими хакерами Главного радиочастотного центра Роскомнадзора в ноябре 2022 г., "Яндекс.Толока" используется Роскомнадзором для обучения нейросетей ищущего "запрещённый контент" "Чистого интернета".[21]

Исследования в Толоке

[править | править код]

Толока — это не только инструмент для решения прикладных задач, но и площадка для научных исследований в разных предметных областях. В мае 2019 года команда сервиса начала публиковать наборы данных для некоммерческих, академических целей, чтобы поддержать научное сообщество и привлечь исследователей в Толоку. Датасеты могут быть интересны исследователям разных направлений: для лингвистических исследований, для задач компьютерного зрения, для тестирования моделей агрегации вердиктов исполнителей и обучения чат-ботов[22].

Примечания

[править | править код]
  1. 1 2 "Яндeкс назвал своим лучшим толокeром житeля Чeлябинска". АН "Доступ". 23-08-2017. ((cite news)): Проверьте значение даты: |date= (справка)
  2. 1 2 3 Александр Лычавко (15-01-2018). "«Зимой выхлопные газы кажутся лидару стеной». Как в минском офисе «Яндекса» разрабатывают беспилотники". dev.by. ((cite news)): Проверьте значение даты: |date= (справка)
  3. Дмитрий Шихов (17-01-2018). "Uber в ритейле: как это работает". Rusbase. ((cite news)): Проверьте значение даты: |date= (справка)
  4. Алексей Берилло (23-10-2017). "Конференция Nvidia GTC 2017 Europe: первым делом автопилоты". ixbt.com. ((cite news)): Проверьте значение даты: |date= (справка)
  5. 1 2 Роман Рожков (23-08-2017). "«Яндекс» подключил «Королева» к поискам". Комерстантъ. ((cite news)): Проверьте значение даты: |date= (справка)
  6. 1 2 3 4 5 TolokaTeam (20-07-2016). "Яндекс.Толока. Как люди помогают обучать машинный интеллект". habrahabr. ((cite news)): Проверьте значение даты: |date= (справка)
  7. Денис Сухов (22-08-2017). "Компания «Яндекс» представила новый поисковый алгоритм «Королев»". Комсомольская Правда. ((cite news)): Проверьте значение даты: |date= (справка)
  8. 1 2 Иван Кущ (23-08-2017). "Нейросети, космос, человек: «Яндекс» представил новый поиск". Будь мобильным!. ((cite news)): Проверьте значение даты: |date= (справка)
  9. Екатерина Еникеева (30-01-2018 г.). "Как робот-переводчик находит и выучивает новые слова". N + 1. ((cite news)): Проверьте значение даты: |date= (справка)
  10. "«Яндекс» запустил эксперимент «Контрольная закупка на Маркете»". retail.ru. 13-02-2017. ((cite news)): Проверьте значение даты: |date= (справка)
  11. "В товарных отзывах на "Маркете" появятся фото". oborot.ru. 05-04-2017. ((cite news)): Проверьте значение даты: |date= (справка)
  12. "«Яндекс.Маркет» предложил пользователям писать отзывы к товарам за деньги". Афиша daily. 20-02-2017. ((cite news)): Проверьте значение даты: |date= (справка)
  13. Саша Море (02-02-2018). "Дизайн продукта от начала до конца". vc.ru. ((cite news)): Проверьте значение даты: |date= (справка)
  14. Василий Волнухин (13-02-2018). "Директор Яндекса по технологиям: программисты из России – это уже давно серьезный бренд". ((cite news)): Проверьте значение даты: |date= (справка)
  15. Daria Khokhlova (10-10-2017). "Как «Яндекс» создавал «Алису»". vc.ru. ((cite news)): Проверьте значение даты: |date= (справка)
  16. "Чем жила Челябинская область: главные новости недели". АН "Доступ". 27-08-2017. ((cite news)): Проверьте значение даты: |date= (справка)
  17. 1 2 Татьяна Петрущенкова (08-04-2019). "«Мы хотим монетизировать экспертизу в краудсорсинге»". Rusbase. ((cite news)): Проверьте значение даты: |date= (справка)
  18. Давид Нармания (2017-09-23). "Двадцать лет спустя: как "Яндекс" стал не только поисковиком". РИА новости.
  19. "Челябинец стал лучшим тестером Яндекса". ГТРК “Южный Урал”. 23-08-2017. ((cite news)): Проверьте значение даты: |date= (справка)
  20. "Чернокнижники. Как закон о «пропаганде» ЛГБТ, вступивший в силу неделю назад, уже изменил издательский рынок". Медиазона. 2022-12-12.
  21. "Архитектура российской цензуры: что мы узнали из крупнейшей утечки в истории Роскомнадзора. Главное". Русская служба Би-би-си. 2022-02-09.
  22. Яндекс открывает датасеты Толоки для исследователей. habr.com. Дата обращения: 2 июля 2019.
{{bottomLinkPreText}} {{bottomLinkText}}
Толока (сервис)
Listen to this article

This browser is not supported by Wikiwand :(
Wikiwand requires a browser with modern capabilities in order to provide you with the best reading experience.
Please download and use one of the following browsers:

This article was just edited, click to reload
This article has been deleted on Wikipedia (Why?)

Back to homepage

Please click Add in the dialog above
Please click Allow in the top-left corner,
then click Install Now in the dialog
Please click Open in the download dialog,
then click Install
Please click the "Downloads" icon in the Safari toolbar, open the first download in the list,
then click Install
{{::$root.activation.text}}

Install Wikiwand

Install on Chrome Install on Firefox
Don't forget to rate us

Tell your friends about Wikiwand!

Gmail Facebook Twitter Link

Enjoying Wikiwand?

Tell your friends and spread the love:
Share on Gmail Share on Facebook Share on Twitter Share on Buffer

Our magic isn't perfect

You can help our automatic cover photo selection by reporting an unsuitable photo.

This photo is visually disturbing This photo is not a good choice

Thank you for helping!


Your input will affect cover photo selection, along with input from other users.

X

Get ready for Wikiwand 2.0 🎉! the new version arrives on September 1st! Don't want to wait?