Ubuntu安装配置ROUGE教程

前言

  这次做自然语言处理的作业,是关于多文档摘要生成的,其中对于生成的摘要进行效果测评需要用到ROUGE(不是那个文本高亮的插件!!)。没想到安装这个软件这么麻烦,于是写个博客造福后人了。

ROUGE简介

  ROUGE是由微软亚洲研究院知识挖掘组(The Knowledge Mining group at Microsoft Research Asia)调研经理(research manager) Chin-Yew Lin 研发的,用于摘要的自动评价,通过比较机器自动生成的摘要(called system_summary)与人工生成的摘要(called model_summary, 认为它是理想的)中重叠单元的数量,来评价机器自动生成的摘要。该方法中考虑的重叠单元有n-gram, word sequences, word-pairs等,并提出了四个测量标准ROUGE-N, ROUGE-L, ROUGE-W, ROUGE-S。 
  该包用Perl语言编写,目前版本为ROUGE-1.5.5。

说实话ROUGE真心是难装,按理说在Ubuntu下几行命令就应该要安装成功一个程序,可是ROUGE完全没有体现这一点。

安装要求

  1. 需要安装perl解释器(ubuntu 系统已自带, 通过perl -v可查看当前版本); 
  2. 需要额外安装perl解释器的XML::DOM模块以及DB_File模块,而XML::DOM的安装又需要XML::RegExp、XML::Parser、LWP::UserAgent和XML::Parser::PerlSAX模块(对,就是这么恶心); 
  3. 设置系统环境变量ROUGE_EVAL_HOME,需要设置为ROUGE安装目录下词库data所在路径

获取方法

现在不知道官网是哪个了,不过可以从github上获取,也可以从我的主机宝贝资源站(1.5.5版本)获取,另外其他依赖的模块包我也放进这个链接里了,可以一起下载省去寻找的麻烦。

可以到主机宝贝资源站下载:

安装过程

step1: 检查perl版本

因为DOM要求perl版本要在5.6.0以上,所以先在终端用perl -v查看一下当前版本,版本较低的话先升级一下perl。

step2: 安装XML::Parser

假设使用我百度网盘里的文件,将XML-Parser-2.44.tar解压到当前文件夹或指定路径。

tar -zxvf XML-Parser-2.44.tar.gz1

进入解压得到的文件夹并开始安装。

cd XML-Parser-2.44
perl Makefile.PL
make
make test # if %%%Result看到PASS为成功就继续,否则仔细看哪个case报错了
sudo make install # if %%%必须要sudo,否则可能没有读写文件的权限12345

step3: 安装XML::RegExp

step4: 安装LWP::UserAgent

LWP::UserAgent是libwww-perl中的一部分,直接用apt-get安装就好啦。

sudo apt-get update
sudo apt-get install libwww-perl12

step5: 安装XML::Parser::PerlSAX

这个模块是libxml-perl中的一部分,也可以直接用apt-get安装(其实我在想前面几个模块能不能也这么安装)。

sudo apt-get install libxml-perl1

step6: 安装XML::DOM

Test Summary Report
——————-
t/build_dom.t      (Wstat: 512 Tests: 1 Failed: 1)
  Failed test:  1
  Non-zero exit status: 2
  Parse errors: Bad plan.  You planned 2 tests but ran 1.
Files=21, Tests=128,  2 wallclock secs ( 0.07 usr  0.01 sys +  1.56 cusr  0.10 csys =  1.74 CPU)
Result: FAIL
Failed 1/21 test programs. 1/128 subtests failed.
Makefile:968: recipe for target ‘test_dynamic’ failed
make: *** [test_dynamic] Error 2551234567891011

可以用这两行命令修复一下。

sudo apt-get install -f
sudo apt-get update –fix-missing 12

step7: 安装DB_File

先获得DB_File的安装包,可以用如下命令,也可以从我给的网盘链接里直接下载。

sudo wget http://www.cpan.org/authors/id/P/PM/PMQS/DB_File-1.835.tar.gz1

接下来如同step2,进入文件夹后使用perl命令安装。

cd DB_File-1.835
perl Makefile.PL
make
make test # if %%%看到PASS为成功
sudo make install12345

在make的时候如果出错如下:

version.c:30:16: fatal error: db.h: 没有那个文件或目录
compilation terminated.
Makefile:360: recipe for target ‘version.o’ failed
make: *** [version.o] Error 11234

说明未安装Berkeley DB library,或安装不正确。解决方法如下:

sudo apt-get install libdb-dev1

如果还没有用,可能是没有安装对应的版本,先使用

sudo apt-cache search libdb1

查看当前Berkeley DB library 的版本,然后再安装对应的版本.

sudo apt-get install libdb5.3-dev1

step8: 设置ROUGE环境变量

设置环境变量ROUGE_EVAL_HOME,假设你解压的ROUGE-1.5.5在/usr/local/RELEASE-1.5.5,则:

sudo gedit etc/profile %%%这样对所有用户都有效,若希望仅对当前用户有效则输入sudo gedit ~/.profile 1

在跳出来的文本编辑器末尾添加 :

export ROUGE_EVAL_HOME=”$ROUGE_EVAL_HOME:/usr/local/RELEASE-1.5.5/data”1

step9: 测试安装是否成功

以上步骤都进行完毕后,怎么知道自己的ROUGE是否安装配置成功了呢?可以进入ROUGE文件所在路径(即RELEASE-1.5.5),然后运行一下runROUGE-test.pl文件。

perl runROUGE-test.pl1

如果有以下输出,且sample-output路径下各个文件都有内容的话,基本是安装成功了。

../ROUGE-1.5.5.pl -e ../data -c 95 -2 -1 -U -r 1000 -n 4 -w 1.2 -a ROUGE-test.xml > ../sample-output/ROUGE-test-c95-2-1-U-r1000-n4-w1.2-a.out
../ROUGE-1.5.5.pl -e ../data -c 95 -2 -1 -U -r 1000 -n 4 -w 1.2 -a -m ROUGE-test.xml > ../sample-output/ROUGE-test-c95-2-1-U-r1000-n4-w1.2-a-m.out
../ROUGE-1.5.5.pl -e ../data -c 95 -2 -1 -U -r 1000 -n 4 -w 1.2 -a -m -s ROUGE-test.xml > ../sample-output/ROUGE-test-c95-2-1-U-r1000-n4-w1.2-a-m-s.out
^C../ROUGE-1.5.5.pl -e ../data -c 95 -2 -1 -U -r 1000 -n 4 -w 1.2 -l 10 -a ROUGE-test.xml > ../sample-output/ROUGE-test-c95-2-1-U-r1000-n4-w1.2-l10-a.out
../ROUGE-1.5.5.pl -e ../data -c 95 -2 -1 -U -r 1000 -n 4 -w 1.2 -l 10 -a -m ROUGE-test.xml > ../sample-output/ROUGE-test-c95-2-1-U-r1000-n4-w1.2-l10-a-m.out
../ROUGE-1.5.5.pl -e ../data -c 95 -2 -1 -U -r 1000 -n 4 -w 1.2 -l 10 -a -m -s ROUGE-test.xml > ../sample-output/ROUGE-test-c95-2-1-U-r1000-n4-w1.2-l10-a-m-s.out
../ROUGE-1.5.5.pl -e ../data -c 95 -2 -1 -U -r 1000 -n 4 -w 1.2 -b 75 -a ROUGE-test.xml > ../sample-output/ROUGE-test-c95-2-1-U-r1000-n4-w1.2-b75-a.out
../ROUGE-1.5.5.pl -e ../data -c 95 -2 -1 -U -r 1000 -n 4 -w 1.2 -b 75 -a -m ROUGE-test.xml > ../sample-output/ROUGE-test-c95-2-1-U-r1000-n4-w1.2-b75-a-m.out
../ROUGE-1.5.5.pl -e ../data -c 95 -2 -1 -U -r 1000 -n 4 -w 1.2 -b 75 -a -m -s ROUGE-test.xml > ../sample-output/ROUGE-test-c95-2-1-U-r1000-n4-w1.2-b75-a-m-s.out
../ROUGE-1.5.5.pl -e ../data -3 HM -z SIMPLE DUC2002-BE-F.in.26.lst 26 > ../sample-output/DUC2002-BE-F.in.26.lst.out
../ROUGE-1.5.5.pl -e ../data -3 HM DUC2002-BE-F.in.26.simple.xml 26 > ../sample-output/DUC2002-BE-F.in.26.simple.out
../ROUGE-1.5.5.pl -e ../data -3 HM -z SIMPLE DUC2002-BE-L.in.26.lst 26 > ../sample-output/DUC2002-BE-L.in.26.lst.out
../ROUGE-1.5.5.pl -e ../data -3 HM DUC2002-BE-L.in.26.simple.xml 26 > ../sample-output/DUC2002-BE-L.in.26.simple.out
../ROUGE-1.5.5.pl -e ../data -n 4 -z SPL DUC2002-ROUGE.in.26.spl.lst 26 > ../sample-output/DUC2002-ROUGE.in.26.spl.lst.out
../ROUGE-1.5.5.pl -e ../data -n 4 DUC2002-ROUGE.in.26.spl.xml 26 > ../sample-output/DUC2002-ROUGE.in.26.spl.out123456789101112131415

至此就全部大功告成啦!

Ubuntu安装配置pyrouge

之前配置pyrouge是很麻烦的事,安装完之后会各种报错,解决起来令人头皮发麻。

这次重新安装ROUGE和pyrouge,找到了一种简洁的安装pyrouge的方法,不会出错,非常方便。记录一下。

很简单,就是几行命令。

git clone https://github.com/bheinzerling/pyrouge
cd pyrouge
Python setup.py install
python -m pyrouge.test1234

在最后一步,python -m pyrouge.test前,要设置rouge路径。

pyrouge_set_rouge_path /absolute/path/to/ROUGE-1.5.5/directory1

例如我的ROUGE文件放在了/usr/local/RELEASE-1.5.5下,就设置为

pyrouge_set_rouge_path /usr/local/RELEASE-1.5.5

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/213123.html<

(0)
运维的头像运维
上一篇2025-04-11 04:35
下一篇 2025-04-11 04:37

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注