Сохранен 4
https://2ch.hk/pr/res/544369.html
Прошлые домены не функционирует! Используйте адрес ARHIVACH.VC.
24 декабря 2023 г. Архивач восстановлен после серьёзной аварии. К сожалению, значительная часть сохранённых изображений и видео была потеряна. Подробности случившегося. Мы призываем всех неравнодушных помочь нам с восстановлением утраченного контента!

Wikipedia

 Аноним 17/09/15 Чтв 11:30:54 #1 №544369 
14424786543280.png
Сап, программач.
Я тут себе поставил задачку пропарсить всю википедию. Вообще нужно выдрать из неё все статьи, в которых есть координаты и как-то из классифицировать, например разбить на города, знания, монументы и пр. То есть подетектить максимум шаблонов. Кто в курсе есть ли у wiki-движка какие-нибудь инструменты для автоматизации анализа подобного рода. Или нужно просто ручками по всем статьям пробегать и текст парсить: категории, шаблоны?
Аноним 17/09/15 Чтв 12:26:27 #2 №544390 
https://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%9A%D0%B0%D0%BA_%D1%81%D0%B4%D0%B5%D0%BB%D0%B0%D1%82%D1%8C_%D0%BA%D0%BE%D0%BF%D0%B8%D1%8E_%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D0%B8
Аноним 17/09/15 Чтв 12:28:17 #3 №544393 
>>544369 (OP)
Начни с того, что скачай дамп с https://dumps.wikimedia.org/
Попробуй посмотреть, какие категории есть, может будет достаточно детектить по категории статьи. Если нет - ебашь по старинке, парсишь каждую статью и категоризируешь.
Аноним 17/09/15 Чтв 12:42:42 #4 №544400 
>>544369 (OP)
Открой для себя https://www.wikidata.org/wiki/Wikidata:Main_Page
comments powered by Disqus