Сап, программач. Я тут себе поставил задачку пропарсить всю википедию. Вообще нужно выдрать из неё все статьи, в которых есть координаты и как-то из классифицировать, например разбить на города, знания, монументы и пр. То есть подетектить максимум шаблонов. Кто в курсе есть ли у wiki-движка какие-нибудь инструменты для автоматизации анализа подобного рода. Или нужно просто ручками по всем статьям пробегать и текст парсить: категории, шаблоны?
>>544369 (OP) Начни с того, что скачай дамп с https://dumps.wikimedia.org/ Попробуй посмотреть, какие категории есть, может будет достаточно детектить по категории статьи. Если нет - ебашь по старинке, парсишь каждую статью и категоризируешь.
Я тут себе поставил задачку пропарсить всю википедию. Вообще нужно выдрать из неё все статьи, в которых есть координаты и как-то из классифицировать, например разбить на города, знания, монументы и пр. То есть подетектить максимум шаблонов. Кто в курсе есть ли у wiki-движка какие-нибудь инструменты для автоматизации анализа подобного рода. Или нужно просто ручками по всем статьям пробегать и текст парсить: категории, шаблоны?