Skip to content

Модель uaddress для библиотеки Deepparse

Notifications You must be signed in to change notification settings

RapidappsIT/uaddress_deepparse

Repository files navigation

UAddress - Deepparse model

Модель uaddress для библиотеки deepparse

Read this in other language: English, Русский, Український

Требования

  • python3
  • deepparse
  • pandas
  • colored

Установка зависимостей

pip3 install -r requirements.txt

Подготовка данных

python3 pretrain.py

Обучение модели

python3 train.py

train

Пример

python3 example.py

example

Структура

Файл Описание
example.py Пример разбора адреса на типы
train.py Обучения модели
pretrain.py Подготовка данных для обучения модели
check_data.py Проверка данных для обучения модели
improver.py Улучшение адреса
data/data.csv Данные для обучения модели
data/test.csv Данные для проверки модели после обучения
data/raw.csv Сырые данные для подготовки данных для обучения модели
data/uaddress.ckpt Модель после обучения (bpemb)
data/uaddress_fasttext.ckpt Модель после обучения (Fasttext)

Типы

Название Описание
Country Страна
RegionType Тип области
Region Область
CountyType Тип района
County Район
SubLocalityType Тип подрайона
SubLocality Подрайон
LocalityType Тип населённого пункта
Locality Населённый пункт
StreetType Тип улицы
Street Улица
HousingType Тип корпуса
Housing Корпус
HostelType Тип общежития
Hostel Общежитие
HouseNumberType Тип номера дома
HouseNumber Номер дома
HouseNumberAdditionally Дополнительный номер дома
SectionType Тип секции
Section Секция
ApartmentType Тип квартиры
Apartment Квартира
RoomType Тип комнаты
Room Комната
Sector Сектор
EntranceType Тип подъезда
Entrance Номер подъезда
FloorType Тип этажа
Floor Этаж
PostCode Индекс
Manually Набор типов для дальнейшей разборки адреса
NotAddress Не адрес
Comment Комментарий
AdditionalData Дополнительные данные

Графики

Bpemb

accuracy_bpemb loss_bpemb

Fasttext

accuracy_fasttext loss_fasttext