首页 > 科技项目
人民日报可视化系统

行业分类:大数据与通讯地区:0联系人:王晓慧

融资: 面议    

本系统从网上下载了人民日报从1946年5月创刊以来至目前为止发表的1,365,802篇文章,并进行了文本可视化。该系统包括人民日报数据下载、数据统计、文本处理与可视化等三个模块...

具体了解该项目信息,请致电:027-87555799 邮箱 haizhi@uipplus.com

本系统从网上下载了人民日报从1946年5月创刊以来至目前为止发表的1,365,802篇文章,并进行了文本可视化。该系统包括人民日报数据下载、数据统计、文本处理与可视化等三个模块。首先是实时爬虫程序,下载截止到目前为止最新的人民日报文章,得到题目、内容和发表时间。然后,对下载的文本数据进行统计,包括统计每年包含的文章数量、总文章数量、某个词是否出现在某篇文章中、某个词在一段时间出现在多少篇文章中等。最后,进行文本处理和可视化,包括中文分词、生成词云和提取关键词等。人民日报内容一定程度上代表了中国官方立场。该报纸被联合国教科文组织评为世界十大报纸之一,有广泛影响力。该系统通过对1946年创刊以来至目前人民日报数据的可视化,有助于内容挖掘,分析我国经济、政治等方面的发展,有助于企业决策。