This is Korean News Chronicle Service made by python
With the development of information and communication technology in modern society, information about events occurring in the vicinity can be easily grasped through online news articles. However, as the amount of accessible information increases, the importance of easily retrieving information or selecting appropriate information from the searched information is increasing. In this study, we propose a method to effectively provide event-related information to users by detecting events occurring within a certain period from news article data. The proposed method extracts topics for each news and applies the density-based DBSCAN algorithm to automatically detect events from the results. As a result of the experiment, the performance of the event detection method proposed in this study was superior to that of the existing method.
▸Key words:Event Detection, DBSCAN, News Article, Natural Language Processing, Big Data
정보 통신 기술의 발달로 현대 사회에서는 온라인 뉴스 기사를 통해 주변에서 일어나는 사건들에 대한 정보를 쉽게 파악할 수 있다. 그러나 접근할 수 있는 정보의 양이 많아지면서 정보를 용이하게 검색하거나 검색된 정보 중에서 적합한 정보를 선별하는 일에 대한 중요성이 더욱 커지고 있다. 본 연구에서는 뉴스 기사 데이터로부터 일정기간 내에 발생하는 사건을 탐지하여 사용자들에게 사건 관련 정보를 효과적으로 제공할 수 있는 방법을 제안한다. 제안 방법은 뉴스별로 토픽을 추출하고 그 결과로부터 사건을 자동 탐지하기 위하여 밀도 기반의 DBSCAN 알고리즘을 적용한다. 실험 결과, 본 연구에서 제안하는 사건 탐지 방법의 성능이 기존 방법에 비해 우수한 결과를 보였다.
▸주제어 :사건 탐지, DBSCAN, 뉴스 기사, 자연어처리, 빅데이터
InTimes (https://github.com/SSU-SOFT/In-Times)