Модель uaddress для бібліотеки deepparse
Read this in other language: English, Русский, Український
- python3
- deepparse
- pandas
- colored
pip3 install -r requirements.txt
python3 pretrain.py
python3 train.py
python3 example.py
Файл | Опис |
---|---|
example.py | Приклад розбирання адреси на типи |
train.py | Навчання моделі |
pretrain.py | Підготовка даних для навчання моделі |
check_data.py | Перевірка даних для навчання моделі |
improver.py | Удосконалення адреси |
data/data.csv | Дані для навчання моделі |
data/test.csv | Дані для перевірки моделі після навчання |
data/raw.csv | Сирі дані для підготовки даних для навчання моделі |
data/uaddress.ckpt | Модель після навчання (bpemb) |
data/uaddress_fasttext.ckpt | Модель після навчання (Fasttext) |
Назва | Опис |
---|---|
Country | Країна |
RegionType | Тип області |
Region | Область |
CountyType | Тип району |
County | Район |
SubLocalityType | Тип підрайону |
SubLocality | Підрайон |
LocalityType | Тип населеного пункту |
Locality | Населений пункт |
StreetType | Тип вулиці |
Street | Вулиця |
HousingType | Тип корпусу |
Housing | Корпус |
HostelType | Тип гуртожитку |
Hostel | Гуртожиток |
HouseNumberType | Тип номеру будинку |
HouseNumber | Номер будинку |
HouseNumberAdditionally | Додатковий номер будинку |
SectionType | Тип секції |
Section | Секція |
ApartmentType | Тип квартири |
Apartment | Квартира |
RoomType | Тип кімнати |
Room | Кімната |
Sector | Сектор |
EntranceType | Тип під'їзду |
Entrance | Номер під'їзду |
FloorType | Тип поверху |
Floor | Поверх |
PostCode | Індекс |
Manually | Набір типів для подальшого розбирання адреси |
NotAddress | Не адреса |
Comment | Коментар |
AdditionalData | Додаткові дані |