Милана Глебова
картограф

КАК ВСЕ НАЧИНАЛОСЬ

(для меня и продолжалось для проекта)
После анонса карты возраста домов Петербурга я читала процесс её создания со смешанным чувством большого респекта и легкой зависти: в целом представляя, сколько сил, времени и скиллов скрывается за небрежными формулировками, я задавалась вопросом, почему сама до сих пор не сделала что-то настолько крутое и интересное. Едва ли создатель how-old-is-this-house Никита Славин об этом знал, но, спустя какое-то время, от него поступило предложение присоединиться к московской версии проекта. Размышлять, соглашаться или нет, даже не пришлось.

Апдейт: на самом деле, мои первоначальные оценки потраченных сил, времени и скиллов оказались заниженными раза в три.


Визуализация возраста зданий Москвы - не абсолютно новая идея; подобную вещь несколько лет назад сделал “Меркатор”, сравнительно недавно интерактивную карту опубликовала “Стрелка”. Но обе эти истории посвящены теме жилищного строительства, соответственно показывают только жилые дома, нам же хотелось нарисовать более полную картину.

ИНГРEДИЕНТЫ

В сети есть несколько реестров недвижимости в Москве, но, судя по косвенными признакам, прародитель всех этих сервисов – московский жилой фонд с приблизительно тридцатью тысячами домов. Хорошо, но мало.

Поэтому за основу берем геометрию зданий из открытых данных Росреестра 2016 года: в нем пугающе детально прорисованы объекты вплоть до зазубрин подъездов и выпуклостей архитектурных излишеств. Но главное - большинству домов присвоен год постройки, а ,значит, ядро нашего проекта уже готово, нужно только избавиться от путепроводов, канализационных люков и прочего инфраструктурного шума – остается порядка двухсот тысяч объектов. Продолжаем поиски.
Данные кадастра
Следующий кандидат – OpenStreetMap. В OSM мало полезных нам атрибутивных данных и не столь скрупулезно подробная геометрия, зато гораздо более актуальная информация. В кадастре — данные 2016 года, поэтому на месте новых ЖК, модных лофтов или концертных залов порой все еще стоят громадины заводских цехов или снесенные ныне кварталы.

Кадастр + OSM

Латаем дыры в кадастре кусками слоя OSM, вручную, насколько это возможно, разрешаем пространственные конфликты прошлого и настоящего, и получаем вполне рабочий базовый слой зданий, у большинства из которых даже прописан год постройки. Но хочется еще чего-то интересного и осмысленного – хотя бы названий и фотографий.

Начнем с открытых данных Министерства культуры, они обещают толковое имя и фото. В Москве Минкульт насчитал около пяти тысяч объектов, достойных охраны. Среди них, однако, непропорционально много могил, бюстов, оград и всего прочего, не похожего на здания. К тому же Минкульт с трепетной заботой относится к домам, залам съездов и конспиративным квартирам, куда ступала нога В. И. Ленина, развернуто сообщая об этом в названиях объектов. В результате только половина исходного набора оказывается пригодной к использованию.

Объединенный слой (кадастр + OSM) и точки Минкульта

Фотографий объектов культурного наследия маловато. Экспериментируем с данными из Викимапии. Народная карта коварна. Выгрузка точек-центроидов дает примерно 1 гугол объектов, мешанину маскирующихся друг под друга мух и котлет. Кроме того, сервису не хватает строгости организации данных: адреса идут вперемешку с названиями, а канавы и овраги — с объектами недвижимости. Проявляем чудеса терпения и изобретательности, чтобы отфильтровать все, что похоже на дома. При разборе свалки тэгов сервиса для небольшой части объектов удается выдернуть еще и год постройки (особенно удачно это для молодых зданий, которых еще нет в кадастре), и иногда стиль.
погуглите сколько это - гугол 

Объединенный слой и точки Викимапии

Словом, в духе эдисоновского нахождения N способов, которые не работают, эксперимент с Викимапией себя не оправдал: масса усилий при сомнительной добавленной ценности.
В результате у нас есть слой из 250 000 полигонов с умеренно хаотичной таблицей атрибутов.
ОБРАБОТКА
Для обработки данных я использовала ArcMap и QGIS – каждый из них в роли Mr. Good/Dr. Evil в зависимости от ситуации. С учетом размера рабочего набора данных, оба продукта иногда становились весьма несносными, и приходилось проявлять изобретательность, адаптируя форматы и объем обрабатываемых данных к капризам каждого из них.

Берем полигональный слой-гибрид кадастра и OSM, где объекты из второго добавлены к первому по принципу непересечения.

К нему будем добавлять дополнительную информацию из разных источников, цель – заполнить, насколько возможно, следующие поля, единые для всех городов:
- название,
- год постройки,
- адрес,
- стиль (оптимистически),
- архитектор (супер-оптимически),
- фото,
- ссылки на википедию или другие внешние сайты.

Возраст домов для 129 000 объектов дали кадастровые данные, остальное придется поискать. Начнем с культурного наследия.

В исходнике – точки с атрибутивными данными; прицепляем их к базовому слою полигонов ради адреса, названия и ссылки на фото. Где попадается на глаза, убираем подробности жизни и партийной деятельности вождя коммунизма.

Есть проблема – на многие здания попадает несколько памятников истории и культуры. Приходится избавляться от лишних наложений.

Дальше берем Викимапию и приводим данныe сервиса в человеческий вид: из неструктурированного хаоса – в таблицу с заполненными, где возможно, адресом, названием, годом, иногда стилем и фотографией. Накидываем выжимку точек на базовый слой.

В таблице накопилось несколько полей с адресом и названием из разных источников. В случае с названием выбирать особенно не приходится, действуем по принципу «бери что дают», а вот адресам можно расставить приоритеты. Форма в OSM аккуратно заполнена — сначала возьмем ее. У кадастра немного корявый автоматический формат записи, но большое покрытие – это следующий кандидат. Всему что осталось, прицепляем адрес из Викимапии. Например, многие адреса и названия в Новой Москве родом именно оттуда — этот вклад неожиданно выше, чем фотографии, которые оказались настолько сомнительного качества, что их безопаснее было использовать по минимуму.

Но все же очень хочется иметь красивые фотографии и ссылки на внешние источники. По всем законам приключенческого жанра ближе к финалу появляется великая wikidata, которая поставляет не очень много в абсолютном количестве (12 000), но очень качественные и интересные фотки и ссылки. У этих данных есть забавный спецэффект — качество импорта для менее популярных объектов — выше: на популярных — много пересечений, и автоматически иногда липнет нерелевантная информация.

Итак, из кусков мы, наконец, собрали чудище Франкенштейна, симпатичное и совсем не страшное.


Выстраиваем свой архитектурный зоопарк по росту – вернее, по возрасту, который мы узнали для 129 000 зданий:
И здесь мы видим тот самый пик 1917 года, который объясняет Стрелка и который встречался в Петербурге: все дома с неизвестным годом строительства после революции отнесли к 1917 году. Кроме него заметны декадные пики – 1910, 1900 и т.д.; вероятно, это эффект округления дат при записи возраста дома.

С началом советского периода все становится логично: провал Великой Отечественной войны, бум строительства хрущевок в 1960-х и дальнейший спад вплоть до 1990-х. А вот крошечным значениям последних лет верить нельзя, на самом деле, в 2019 году реновация взяла темп строительства, близкий к советскому.

ПЯТЬДЕСЯТ ОТТЕНКОВ ОТЧАЯНИЯ

На этапе дизайна слоя идет борьба эстетического и содержательного подходов. С одной стороны, непрерывная шкала выглядит эффектнее, с другой – разделение по эпохам лидеров и градоначальников, как это делал в своей карте Меркатор, в случае с Москвой мне кажется более оправданным и информативным.

После серии примерок оказывается, что на разновозрастный центр Москвы непрерывная шкала ложится не очень удачно, нет того эффекта плавно разлитого света, который так завораживает на карте Петербурга. Тем лучше – не придется жертвовать содержанием в пользу формы.

Наиболее безумные цветовые схемы

«Москва-вечеринка» и «Москва после кислотного дождя» смотрятся забавно, но все же хочется сохранить адекватную ассоциацию с городом.

Неочевидно, как разграничить исторические эпохи и периоды строительства. Этот же вопрос ставят наши предшественники, и их решение кажется абсолютно верным: ассоциативный контекст связывает дома либо с советскими лидерами, либо – в наши дни – с градоначальниками. За счет включения нежилых зданий в нашем наборе гораздо больше дореволюционных домов, и эту категорию мы решили разбить. Итого имеем:
- Допетровская Россия
- Российская Империя
- Ленин
- Сталин
- Хрущев
- Брежнев, Андропов, Черненко
- Горбачев
- Лужков
- Собянин

Продолжаем подбирать, на этот раз ориентируясь на дискретную раскраску по эпохам, но стараемся сохранить переход от теплой старины к неоновому свету новостроек. Долго крутим цвета, стараясь, чтобы разные возрасты дружили.

Иногда поиски вели в неожиданном направлении

Побеждает хаотически-ассоциативный подход: красим дореволюционные дома в краснокирпичный цвет старых мануфактур, сталинские высотки и их современников – в ярко-желтый, как стены ГЗ МГУ на ярком солнце, бетонные семидесятые делаем тускловато-зелеными, а современным зданиям к лицу электрически-холодный синий:
—Приходит совет от коллег разбить категорию дореволюционных домов: все же разброс между 14 веком и 20 слишком велик, чтобы его игнорировать, и хочется как-то отделить старину от древности.

Получается здорово: видно, как целыми очередями строились кварталы хрущевок, как монолитно выделяется шрам Нового Арбата и сталинские фасады Тверской.

Так, стоп, а почему Кремль вдруг тоже сталинский? Цветовая схема выявляет недостатки геопроцессинга: каждый этап пространственного объединения объектов – одновременно и новая порция данных, и источник возможных ошибок. Особенно в центре, где плотная застройка и много интересных объектов, велик шанс что на дом в базовом слое наложится точка, обозначающая какое-то здание или событие по соседству, как старательно ни фильтруй новые данные. И все же мне до сих пор интересно, как на месте отеля Four Seasons (перестроенная гостиница Москва) оказался Московский научно-исследовательский институт глазных болезней им. Гельмгольца.


Загружаем получившийся слой на Геосемантику — платформу, которую мы используем для веб карты. Настраиваем отображение объектов и подложку, вид карточки, включаем шкалу — карта готова к встраиванию.
Геосемантика
ИМЕНИ ПОЛИГРАФА ПОЛИГРАФОВИЧА
Верстка постера, в отличие от работы с большими данными, этап знакомый и уютный. Обработка больших данных — процесс не всегда очевидный и часто сопровождаемый нецензурной бранью, но по-своему творческий и интересный.


Показываем только Москву в пределах МКАД; чуть корректируем цвета базовой карты, чтобы адаптировать темные оттенки для печати, остальное — дело техники. Немного манипуляций с масштабом графика распределения домов во имя наглядности, и у нас есть бумажная карта, которую не только приятно повесить на стену загораживать дырку на обоях, но и любопытно рассматривать. Ее можно заказать здесь.
Улыбчивая безымянная девушка из Printful держит виртуальный постер в настоящей раме
СПАСИБО
Спасибо всем, кто помогал создавать и тестировать карту, особенно -


● автору проекта Никите Славину за то, что позвал в балаган играть свою скрипку и учиться другим инструментам – было здорово!
● Семену Павлюку за контакты с цветом московской урбанистики и за то, что до сих пор со мной разговаривает после звонков в час ночи с просьбами помочь в течение вчера.