Ещё из любопытных исторических казусов — несмотря на то, что Северодвинск основан в 1936 году, он выстраивался вокруг старого Николо-Корельского монастыря, первое упоминание о котором относится к 1419 году (благодаря созданной карте можно легко отыскать оставшиеся от монастыря здания). И именно к стенам этого монастыря приплыли заплутавшие английские купцы, что и послужило в дальнейшем причиной основания в 1584 году рядом нового портового города — Архангельска.
Так как города относительно маленькие (в сумме 560 тыс. человек), то я поставил перед собой задачу — сделать самостоятельно всё, что я могу сделать самостоятельно. И 1 сентября 2021 года я сел за работу.
Датасет карты собирался типовым путем — агрегацией данных с открытых баз данных и сопоставлением с картой OpenStreetMap по адресам зданий. Трансформаторные подстанции и пронумерованные цеха заводов удалось частично сопоставить по названиям. Использовался стандартный набор баз (Росреестр, «МинЖКХ», Минкульт) и разрешения на ввод зданий в эксплуатацию на сайтах строительных департаментов соответствующих городов, а также
список памятников архитектуры регионального значения.
Скачивание баз данных и их корректировка, приведение адресов к одинаковому виду и их сопоставление, формирование датасетов велось обычными средствами языка Python. К сожалению, наверное, 95% всего времени было потрачено на корректировки в «ручном режиме», а не на написание кода.
Поскольку много зданий есть сразу в нескольких базах данных, по окончанию работы я провел тест на выявления расхождений в датах постройки и этажности в различных источниках, после чего вручную убрал ошибки.
Итоговая статистика работы следующая:
Зданий в OSM — 28372 (удалось установить год постройки 14639 зданий, т.е. 52%)
Всего зданий в базе Росреестра — 25581
Зданий с уникальным адресом в Росреестре — 15392 (удалось сопоставить 13992)
Зданий в МинЖКХ — 6127 (удалось сопоставить 5707)
Зданий в разрешениях на ввод в эксплуатацию — 1019 (удалось сопоставить 780)
Памятников архитектуры регионального значения — 90 (сопоставлены все)
Зданий в реестре Минкульта — 17 (сопоставлены все)
Проблемы проделанной работы следующие:
1) Как видно из статистики выше, более 10000 зданий в базе Росреестра имеют повторяющийся адрес, что характерно для промышленной застройки. Под одним адресом могут находится несколько десятков цехов. Без наличия дополнительной информации эти данные просто остаются неиспользованными, что невероятно обидно. Т.е. примерно известно, где находится каждое здание, известна его этажность и площадь, но достоверно определить местоположение невозможно.
2) Потребовалось внести очень большое количество изменений в OSM, в моём профиле сейчас отображается 800 пакетов правок (около 2000-3000 зданий). Надеюсь, эти корректировки помогут картографам в каких-нибудь других проектах, и эта работа не будет работой впустую.