三成热门的PyPI软件包被误标为是恶意软件包

研究人员发现,扫描工具原本负责清除通过流行的开源代码存储库PyPI分发的软件包所含的恶意代码,实际上却生成大量的误警报。

PyPI是面向用Python编写的应用程序中使用的软件组件的主要代码库,Chainguard公司分析PyPI后发现,这种方法只揪出了59%的恶意软件包,但也误标了三分之一流行的合法Python软件包和15%的随机选择的软件包。

Chainguard的研究人员在周二的分析报告中表示,研究工作旨在创建一个数据集,以便Python维护人员和PyPI代码库可以用来确定其系统在扫描项目、查找恶意更改和供应链攻击方面的效果。

参与这项研究的Chainguard高级软件工程师Zack Newman表示,虽然现有方法可以检测出大多数恶意软件,但显然需要重大改进,那样才能防止误警报浪费项目经理的时间。

他表示,这些是还有其他工作要做的志愿者,而不是愿意整天搜索可疑代码的安全研究人员。他们格外关注PyPI的安全性,不遗余力地改善这种情况,但眼下收效甚微。

误报是许多软件分析工具的祸根,因此也是安全团队的祸根。即使某个系统能做到百分之百准确地发现恶意软包,如果其误报率为1%,假设每周发布的20000个PyPI软件包中只要有一个是恶意软件包,那么开发人员和应用程序安全专业人员仍然每周需要处理200个假警报。

数百个软件包在研究中触发了警报,虽然研究人员进行了一些抽查,但仅仅快速查看不足以确定某个软件包是否是恶意的——这就是为什么恶意软件检测工具如此重要。代码存储库管理员令人同情,他们每周要面对比这多出十倍的警报。

为了确保实用性,扫描工具需要将误报率降低到0.01%左右,哪怕以遗漏一些恶意软件包为代价。

PyPI的恶意软件扫描方法

PyPI旨在通过以两种方式检查软件包和项目来阻止软件供应链攻击。PyPI使用签名扫描软件包的setup.py文件,以检测可能表明含有恶意功能的已知的可疑模式——签名用YARA规则表示,这是一种创建恶意软件签名的行业标准。YARA的全称是Yet Another Recursive Acronym,与其说是描述性名称,不如说是行业内部的戏称。此外,代码存储库的扫描工具会分析提交项目和贡献者,查找可能表明恶意代码的可疑更改。

研究人员使用168个针对PyPI代码存储库的已知恶意攻击示例构建了数据集。然后,他们创建了第二个数据集,含有1000个下载次数最多的软件包和1000个导入次数最多的软件包;他们消除重复项后,最后得到了1430个流行软件包。另外,他们还创建了一个随机选择的1000个软件包组成的数据集,由于14个软件包没有任何Python代码,最后得到的是986个随机的Python软件包。

研究人员表示,流行软件包和随机选择的软件包都被认为是合法的。此外,流行项目可能有更高的安全性,并遵守编程方面的最佳实践。

研究人员在周二发布的分析报告中写道:“虽然其中一些软件包可能是恶意软件包,但之外的大部分软件包是恶意软件包的可能性微乎其微。重要的是,这些软件包更有可能代表从 PyPI随机选择的软件包。”

开源软件存储库仍然是网络犯罪活动的目标

当下,应用程序安全专业人员和软件开发人员在想方设法为构成普通程序中78%代码的开源软件组件确保安全性。

开源安全基金会(OpenSSF)已采取了多项举措,以提高开源软件供应链的安全性,包括确定需要更严格安全审查的最关键的软件包,以及支持采用SigStore,这个项目通过加密方法将源代码与已编译的软件包关联起来。

在过去这几年,针对软件供应链的攻击有增无减。仅仅在过去一个月,安全公司卡巴斯基就在Node Package Manager(npm)代码存储库中发现了恶意软件,而安全公司Check Point和Snyk发现了托管在PyPI存储库服务上的十多个恶意软件包。

此外,意大利的一名学龄儿童向PyPI上传了多个含有勒索软件脚本的恶意Python软件包,据称此举纯属试验。

不太可能只有PyPI出现有问题的扫描结果。展望未来,Chainguard研究人员计划扩大分析范围,评估至少四款开源软件恶意软件分析工具,比如OSSGadget Detect Backdoor、bandit4ma和OSSF Package Analysis,并将PyPI Malware Checks规则转换成SemGrep,后者是一款多语言开源静态代码分析工具。

本文翻译自:https://www.darkreading.com/application-security/one-third-pypi-packages-mistakenly-flagged-malicious如若转载,请注明原文地址。

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/135928.html<

(0)
运维的头像运维
上一篇2025-03-01 20:35
下一篇 2025-03-01 20:37

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注