Research of the russian tg chat about crossing the border on unsuccessful cases of crossing the border
Исследование про чат "Пограничный контроль" - российского телеграмм-чата про пересечения границы на неудачные случаи пересеения границы
Всем привет. Это мой проект исследования случаев пересечения россиянами российской границы с начала мобилизации. Предварительные результаты исследования можно посмотреть в моей статье на VC.ru:
Все наработки из этого проекта доступны для свободного использования в рамках лицензий используемых фреймоворков. Можете еще и меня упомянуть, если будете где-то это использовать, хотя я сильно в этом сомневаюсь
Десктопное приложение для разметки. Необходимо для разметки сообщений с случаями пересечения границы. Сообщения берет из БД.
Десктопное приложение для сепарции сообщений. В некоторых сообщениях из чата содержится несколько случаев разделенных разделителем, состоящим из нижних подчеркиваний. Приложение берет сообщения из БД и записывает разделенные части в БД.
Предназначен для сбора сообщений из чата телеграм и записи их в БД.
Содержит в себе описание UI для десктопных приложений
Сайт на django c двумя сервисами: razmetka - сервис для разметки случаев, аналог декстопного приложения pograncotrol.py и pogran_visualisation - будущий сервис с визуализацией данных.
Так как разметка продолжается, ценного в этом файле мало.
Содержит размеченые сообщения с случаями пересечения границы по следующим полям
id
- уникальный номер случаяmsg_id
- уникальный номер сообщения, по которому размечен этот случайcase_mes_id
- уникальный номер части сообщения, по которой размечен этот случайcase_type
- тип случая:success
- удачный,fail
- неудачный,return
- возвратage
- возраст пересекающего границуsex
- пол пересекающего границуcause
- причина отказа в пересеченииarmy_relations
- отношение к воинской службе пересекающегоvus
- военно-учетная специальность пересекающего границу.army_type
- вид войск, к которому относится пересекающий.army_sec_type
- род войск (в том числе и отдельные рода войск), к которому относится пересекающий.army_other
- другая информация о военной службе, предоставленная пересекающим.country
- страна въездаkpp
- контрольно-пропускной пункт выездаyService
- годы службы, если человек их указалvoenk_region
- региональный (в т. ч. и ГФЗ)военкомат прописки, если человек его указалvoenk_city
- городской военкомат прописки, если человек его указалvoenk_district
- районный военкомат прописки, если человек его указалkategory_h
- категория здоровья человекаkategory_z
- категория запаса человекаdate
- дата сообщения или пересечения границы
Содержит размеченые сообщения из чата с 20.09.2022 по 12.04.2023 с уникальным номером и датой публикации
Содержит разделенные случаи из сообщений из чата с 20.09.2022 по 12.04.2023
id
- уникальный номер части сообщенияmsg_id
- уникальный номер сообщения, из которого получена эта частьtext
- текстtag
- метка части:marked
- размечена,busy
- занята пользователем,delete
- к удалению,pass
- пропушена пользователем,manual
- требует ручной разметкиauthor
- автор разметки
- Разметить все сообщения, написать красивую страницу с визуализацией результатов
- При разметке достаточного количества сообщений прикрутить нейронную сеть для категоризации Помочь разметить сообщения вы можете по адресу: http://176.126.103.48:8000/razmetka/. Логин и пароль запросите у меня по адресу [email protected], в теме письма укажите: "Разметка. Погранконтроль"