Skip to content

Latest commit

 

History

History
97 lines (45 loc) · 2.65 KB

README.md

File metadata and controls

97 lines (45 loc) · 2.65 KB

任务

输入一段文本,使用 TextRank算法 从输入文本中提取关键词和摘要(重要的句子)

源代码地址

https://github.com/Lotus-Blue/Key-Sentece-TextRank-Flask

上面是本人整理的代码,其中算法部分代码来源于开源项目

https://github.com/letiantian/TextRank4ZH

配置方案与运行截图

TextRank算法

配置方案

安装

进入含有setup.py文件的文件夹中,以此目录为当前路径进入终端输入下面命令行进行安装

$ sudo python setup.py install

注意: Python 3下需要将上面的python改成python3pip改成pip3

卸载

pip uninstall textrank4zh

依赖

jieba >= 0.35 numpy >= 1.7.1 networkx >= 1.9.1

兼容性

Python 3.6中测试通过。

运行截图

image-20191227224958562

image-20191227224958562

image-20191227224958562

Flask配置

配置方案

安装Flask

pip install flask

注意: Python 3下需要将上面的python改成python3pip改成pip3

卸载Flask

pip uninstall flask

代码目录结构

image-20191227224958562

其中template文件夹下为前端样式,只要是提交框以及新闻呈现样式

app.py文件则是Flask的启动文件,可以在里面配置路由及启动后台

兼容性

Python 3.6中测试通过。

运行截图

image-20191227224958562

image-20191227224958562

学习心得

​ 通过本案例,深深感受到互联网及数据科学正在改变着我们的生活,如今文本关键句子可以通过算法找出,这在以前非信息时代,估计是人们口中的天方夜谭。通过这个TextRank算法,我们可以输入一篇新闻内容,然后算出该新闻内容的所有句子中的权重,将权重较高的句子输出,本人通过多次测试,发现输出的文本摘要还算可以,大部分情况下前后语句都流畅,并且本人有时也在用这个系统。

​ 数据科学的无穷魅力,虽然我对TextRank算法只是略知一二,算法部分的代码是找的开源的项目,但Flask部分完全是我写的,因为我想把这个系统可视化,然后将其展示出成一个网页的形式。

​ 本人由于课程学业繁忙,对这些算法都只是略知一二,但挺感兴趣,因为我觉得这些算法,比如PersonalRank算法都非常有用,能产出良好的效果,大大减少了人的判断时间!而本例中的TextRank算法可以大大缩短人们的阅读时间!