Бороться со спамом можно с пользой... для архивов
18.08.2008
Ученые приспособили программу CAPTCHA, которая различает компьютеров и людей в Сети, для перевода бумажных текстов, созданных в "докомпьютерную" эпоху, в цифровой формат. Созданная американскими специалистами программа reCAPTCHA при помощи пользователей интернета позволяет расшифровывать тексты с более чем 99 процентной точностью. Как сообщают создатели reCAPTCA в своей статье, опубликованной в журнале Science, к настоящему моменту программа перевела из "аналога" в "цифру" 440 миллионов слов.
Разработанная в Университете Карнеги-Меллона в Питтсбурге программа CAPTHA (от англ. Completely Automated Public Turing test to tell Computers and Humans Apart - полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей) позволяет определить, кем является пользователь системы: машиной или человеком. Перед выполнением какого-либо действия (например, отправки e-mail-сообщения или регистрации на форуме) CAPTCHA просит пользователя распознать какое-либо слово или набор букв и/или цифр и ввести его с клавиатуры. Для человека подобная операция не составляет труда, однако оптические считывающие устройства, применяемые, например, программами по рассылке спама, часто не справляются с этой задачей.
Интернет-пользователи используют программу CAPTCHA около 200 миллионов раз в день. Исходя из расчета, что на распознавание и ввод одного слова (или набора букв и цифр) у человека, в среднем, уходит 10 секунд, специалисты из Университета Карнеги-Меллона подсчитали, что ежедневно человечество "теряет" около 500 тысяч часов печатного времени. Ученые решили употребить его для оцифровки книжных и газетных архивов.
Первым шагом для перевода бумажных текстов в цифровой формат является их "прочтение" с помощью оптических считывающих устройств. Из-за дефектов, возникших при хранении (например, пожелтения бумаги или расплывания шрифта) сканеры не могут распознать, в среднем, одно слово из пяти. Сомнительные слова расшифровываются вручную. reCAPTCHA перекладывает эту задачу на пользователей Сети. Программа отбирает неопознанные слова и предлагает их интернетчикам вместо обычного набора CAPTCHA. Если три пользователя опознают сомнительное слово одинаково, reCAPTCHA добавляет этот вариант в финальный текст.
Работа программы была протестирована на архивах газеты The New York Times. reCAPTCHA успешно перевела в "цифру" ее подшивку за 1908 год. Сейчас она "взялась" за следующие выпуски. Кроме того, интернет-пользователи с помощью reCAPTCHA оцифровывают книги из архива Internet Archive.
Другие новости по теме 'Новые технологии'
Воронежские новости
05.05.2015 | Сегодня Мечел-Сервис отмечает 10-летний юбилей
Компания Мечел-Сервис (сбытовое предприятие группы Мечел) отмечает десять лет со дня основания.
История Мечел-Сервиса началась в 2005 г. в Челябинске – городе, где находится главный поставщик компании - Челябинский металлургический комбинат (также входит в группу Мечел). На момент создания были... |
12.01.2014 | В Воронеже закрыли очередное подпольное казино
В Воронеже прекращена деятельность очередного подпольного казино. В этот раз, полицейские «зашли» в игорное заведение на улице Димитрова. Сотрудникам правоохранительных органов поступила информация о том, что в павильоне, где должно располагаться общество с ограниченной ответственностью, ведется незаконная игровая... |
19.08.2013 | Похитительница младенца предстанет перед судом
Ранее судимая жительница Волгоградской области предстанет перед судом за похищение младенца в Воронеже, которого она, по ее словам, хотела усыновить. Ранее сообщалось, что трехмесячного мальчика похитили рано утром 7 июня. Его родители приехали в Воронеж из области, чтобы снять... |
21.06.2013 | Перевод пенсионных накоплений - дело серьезное
В Воронежской области по-прежнему имеют место случаи посещения домов людьми, представляющихся сотрудниками Пенсионного фонда России.
Отделение ПФР по области обращает внимание жителей, что сотрудники Фонда не проводят никаких консультаций жителей на дому. Прием граждан осуществляется в территориальных органах Пенсионного... |
11.06.2013 | Без вести пропавший житель терновского села вернулся домой спустя 17 лет
Все эти годы он собирал деньги на дорогу домой.
Юрий Шаталов пропал 17 лет назад. Тогда ему было 34 года. Он жил в Санкт-Петербурге с женой и дочерью, маленькой Настей. Жизнь покатилась под откос, когда Юрий потерял работу, а потом... |
11.06.2013 | Земли ВГАУ - район перспективного развития Воронежа
Районом перспективного развития Воронежа в северном направлении являются земли Воронежского государственного аграрного университета имени Глинки.
Комплексная застройка территории, на которой расположены старые сады ВГАУ, была предусмотрена планами Воронежа прошлых лет, также предусмотрена и новым, пока еще не принятым, Генпланом. Некоторые... |
05.06.2013 | В Воронеже идет выставка-продажа индийских товаров
С 31 мая по 9 июня в спорткомплексе «Энергия» (ул. Ворошилова, 1а) проходит выставка-продажа товаров из Индии.
По словам организаторов, в ней примут участие около 90 индийских компаний. И увидеть, и приобрести здесь можно вручную расшитые покрывала и туники,... |
29.04.2013 | Сергей Лазарев выступил в юбке
В воскресенье Воронеже выступал Сергей Лазарев. 30-летниц певец привез поклонникам свое новое шоу "Лазарев. Точка".
Постановка на высшем уровне - звук, свет, подборка видео, танцы. И выкладывался Сергей по полной - пел живьем, танцевал до изнеможения, что не успевал вытирать... |
18.12.2012 | ZOW Essentials представила мебель будущего
Впервые в рамках 9-ой международной выставки мебельной фурнитуры и комплектующих 20-21 ноября работала специальная конференционная площадка ZOW Essentials. Программа была посвящена глобальному мебельному прогрессу, мебельным трендам, а также инновационным материалам, аксессуарам и комплектующим для мебельной промышленности. Центральным событием ZOW... |
18.12.2012 | Реставрация старейшего некрополя завершается в Воронеже
Реставрация объекта историко-культурного наследия регионального значения "Терновое кладбище" завершается в Воронеже, сообщает пресс-центр губернатора и правительства области в понедельник.
Глава региона Алексей Гордеев, ознакомившись с ходом восстановительных работ, отметил, что "этот мемориал станет гордостью Воронежа и символичным памятным местом... |
Актуальные темы
"Движения" • HDTV. Спутниковое телевидение • VIP -новости • Авто • Аналитика • Баскетбол • Борьба с наркотиками • Бюджет • В Госдуме • В Правительстве • В Совете Федерации • ВВП • Военные конфликты • Воронеж • Выборы 2008 • Государства • Громкие дела • Дела банковские • Детские новости • Домашний кинотеатр • Другие конфессии • Европа • Единое экономическое пространство • Железо • Жизнь политических партий • Защита прав потребителя • Инвестору • Интернет • Инфляция • Квартирный вопрос • Концерты "Звезд" • Космос • Кругозор • Крупные проекты • Кто куда • Культура • Лауреаты • Лесной кодекс • Льготные выплаты • Мобильные телефоны • Мода • Надзор • Назначения • Научная жизнь • Национальный проект «Здоровье» • Национальный проект «Образование» • Нелегалы • Новости компаний • Новые технологии • О налогах • Образ жизни • Общественная палата • Олимпиада • Операторы связи • Оплата труда • Оппозиция • Открытия • Память • Пенсионная реформа • Пенсия • Первые лица • Питание и диеты • Планета • Подготовка к ЕГЭ • Права человека • Православие • Православие и Государство • Происшествия • Разное • Реформа ЖКХ • Россия • Россия и ВТО • Россия и другие... • Россияне в Мире • Секс и здоровье • Сенсация • Скандал • Смертная казнь • Сомелье • Соседи • Софт • Сочи 2014 • Спорт • Стихия • Столица • Страхование • Судебные решения • Судьба доллара • Теннис • Терроризм • Трибуна • Умный дом • ФАС • Фестивали • Формула 1 • Фоторепортаж • Футбол • Хоккей • Цены на нефть • Цифры • Человеческий фактор • Эвтаназия • Экология