DeepSeek深度解析政府工作报告:今年有2大关键词(图)
新闻来源: 澎湃新闻 于2025-03-05 2:31:09 提示:新闻观点不代表本网立场 分享
2025年3月5日上午,十四届全国人大三次会议在人民大会堂举行开幕会,国务院总理李强作政府工作报告。
基于2025年《政府工作报告》,澎湃新闻透过DeepSeek AI大模型,使用文本向量化的数据分析方法,深度解析报告中的政策密码。
澎湃新闻分析发现,根据2025年《政府工作报告》,今年的经济社会发展任务里,“发展”和“建设”是两大关键词。

以“发展”为关键词,通过文本向量化分析,澎湃新闻找到了上百个关联度较高的词汇,如“经济”“创新”“产业”“民生”等。
不仅如此,2025年《政府工作报告》中,“建设”也在围绕着“现代化”“教育”“科技”等维度展开。
结合中国政府网上的1978年-2024年的《政府工作报告》,澎湃新闻进一步回顾了这48年的《政府工作报告》。

分析发现,48年间,“发展”“建设”以及“经济”等词汇,一直高频出现,是《政府工作报告》中的“常青词汇”。

还有部分词语愈发频繁地出现在《政府工作报告》中,比如“创新”“民生”“就业”。因其增长趋势,澎湃新闻将此类词语称为“喇叭形词语”。
另外,在2025年《政府工作报告》中,还出现了过去47年未曾提及的词语,例如“具身智能”“智能机器人”“投资于人”等。

分析方法:
1. 本文所有原始文本材料来自中国政府网1978年至2025年政府工作报告。
2. 基于DeepSeek等AI大模型的文本向量化技术,对2025年工作展望的高频词进行关联分析,通过提取共现向量和语义相似度向量,量化计算高频词间的关联关系。
3. 本文使用jieba分词。采用精确分词模式,避免重复分词和歧义。分词结果均去掉数字、单字、标点符号。
4. 为增加分词正确率,在jieba分词的基础上加入自定义词典,自定义词典主要包含了往年人民网和新华网统计的两会热词。
5. 在分词基础上,采用TF-IDF加权技术。词语的重要性随着它在文本中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。本文使用的语料库为1978年至2025年政府工作报告文本。
基于2025年《政府工作报告》,澎湃新闻透过DeepSeek AI大模型,使用文本向量化的数据分析方法,深度解析报告中的政策密码。
澎湃新闻分析发现,根据2025年《政府工作报告》,今年的经济社会发展任务里,“发展”和“建设”是两大关键词。

以“发展”为关键词,通过文本向量化分析,澎湃新闻找到了上百个关联度较高的词汇,如“经济”“创新”“产业”“民生”等。
不仅如此,2025年《政府工作报告》中,“建设”也在围绕着“现代化”“教育”“科技”等维度展开。
结合中国政府网上的1978年-2024年的《政府工作报告》,澎湃新闻进一步回顾了这48年的《政府工作报告》。

分析发现,48年间,“发展”“建设”以及“经济”等词汇,一直高频出现,是《政府工作报告》中的“常青词汇”。

还有部分词语愈发频繁地出现在《政府工作报告》中,比如“创新”“民生”“就业”。因其增长趋势,澎湃新闻将此类词语称为“喇叭形词语”。
另外,在2025年《政府工作报告》中,还出现了过去47年未曾提及的词语,例如“具身智能”“智能机器人”“投资于人”等。

分析方法:
1. 本文所有原始文本材料来自中国政府网1978年至2025年政府工作报告。
2. 基于DeepSeek等AI大模型的文本向量化技术,对2025年工作展望的高频词进行关联分析,通过提取共现向量和语义相似度向量,量化计算高频词间的关联关系。
3. 本文使用jieba分词。采用精确分词模式,避免重复分词和歧义。分词结果均去掉数字、单字、标点符号。
4. 为增加分词正确率,在jieba分词的基础上加入自定义词典,自定义词典主要包含了往年人民网和新华网统计的两会热词。
5. 在分词基础上,采用TF-IDF加权技术。词语的重要性随着它在文本中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。本文使用的语料库为1978年至2025年政府工作报告文本。
Advertisements
网编:空问站 |
|
7 条 | |||
|
|||||
敬请注意:新闻内容来自网络,供网友多视角阅读参考,观点不代表本网立场!若有违规侵权,请联系我们。 | |||||
【生活原创】【三叶原创】【留园网事】【生活百态】【杂论闲侃】【婚姻家庭】【女性频道】