Back to Search
Start Over
Использование методов машинного обучения для прогнозирования раскрываемости преступлений на основе документов первичного учета
- Publication Year :
- 2021
- Publisher :
- Воронежский институт высоких технологий, 2021.
-
Abstract
- Раскрываемость преступлений является одним из важных показателей деятельности органов внутренних дел. Несмотря на совершенствование методов противодействия преступности и документирования преступной деятельности, раскрываемость преступлений в Российской Федерации остается на уровне 51 %-56 %. В статье описан метод построения математической модели – цифрового двойника зарегистрированного преступления. В качестве исходных данных для построения модели использован массив сведений – документов первичного учета, в отношении 341 тысячи преступлений, совершенных на территории Приморского края за 11 лет – с 2010 по 2020 годы. Модель позволяет: с достоверностью 88 %, на основании формализованной первичной информации, содержащейся в статистических карточках Форма № 1 «На выявленное преступление», строить прогноз о том, будет преступление раскрыто или нет; проводить ревизию нераскрытых преступлений прошлых лет в целях определения преступлений, имеющих высокую вероятность раскрытия; выявлять признаки в статистических карточках, в наибольшей степени влияющие на прогноз раскрываемости преступлений. Модель основана на использовании алгоритмов машинного обучения «градиентный бустинг над решающими деревьями», реализованных в открытой библиотеке искусственного интеллекта CatBoost от компании Яндекс. Точность модели подтверждается составлением и проверкой прогноза раскрываемости в январе-июне 2021 года, 16408 преступлений, совершенных на территории Приморского края.<br />The result of crime-solving is one of the crucial indicators of the law enforcement communities activities. Despite the improvement of crime investigation methods, the success rate of crime detection in the Russian Federation remains at a level of 51%–56%. The article describes a technique for constructing a mathematical model – a digital double of a registered crime. As the initial data for the model development, an array of information - primary accounting documents about 341 thousand crimes, committed on the territory of the Primorsky Krai over 11 years from 2010 to 2020. The model allows you: with 88% confidence, based on the formalized primary information contained in the primary accounting documents – statistical cards Form No. 1 On the detected crime, to make a forecast about whether the crime will be solved or not; to audit unsolved crimes of previous years to determine the crimes that have a high probability of detection; to identify the features in the statistical cards that most affect the forecast of the detection of crimes. The model is based on machine learning algorithms “gradient boosting over decision trees”, implemented in the open library of artificial intelligence CatBoost from Yandex. The model accuracy is confirmed by the preparation and verification of the investigation of the crime's result forecast in January–June 2021 for 16408 guilty acts committed on the territory of the Primorsky Krai.<br />МОДЕЛИРОВАНИЕ, ОПТИМИЗАЦИЯ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ, Выпуск 2 (33) 2021, Pages 30-31
- Subjects :
- искусственный интеллект
feature importance
градиентный бустинг
decision trees
цифровой двойник
статистические карточки
artificial intelligence
машинное обучение
gradient boosting
digital double
predictive model
CatBoost
machine learning
решающие деревья
преступность
прогностическая модель
значимость признаков
crime
statistical cards
Subjects
Details
- Language :
- Russian
- Database :
- OpenAIRE
- Accession number :
- edsair.doi...........e484562dab9f310f7b2e5b21370d5e73
- Full Text :
- https://doi.org/10.26102/2310-6018/2021.33.2.030