GenAI安全:如何防止Microsoft Copilot发生数据泄露

微软的Copilot被称为世界上最强大的生产力工具之一。

Copilot是一个AI助手,它位于你的每个Microsoft 365应用程序中-Word、Excel、PowerPoint、Teams、Outlook等。微软的梦想是从日常工作中解脱出来,让人类专注于成为创造性的问题解决者。

让Copilot成为一个不同于ChatGPT和其他AI工具的工具的是,它可以访问你在365中所做的一切,Copilot可以立即从你的文档、演示文稿、电子邮件、日历、笔记和联系人中搜索和汇编数据,这就是信息安全团队认为存在的问题,Copilot可以访问用户可以访问的所有敏感数据。平均而言,一家公司10%的M365数据对所有员工开放。

Copilot还可以快速生成必须保护的全新敏感数据。在AI革命之前,人类创建和共享数据的能力远远超过了保护数据的能力,只要看看数据泄露的趋势就知道了,GenAI为这把火加了一把油。

作为一个整体,当谈到GenAI时,有很多东西需要拆解:模型中毒、幻觉、深度假冒等,然而,在这篇文章中,我将专门关注数据安全以及你的团队如何确保安全的Copilot推出。

Microsoft 365 Copilot的使用案例

GenAI与M365这样的协作套件的使用案例是无限的,很容易理解为什么这么多IT和安全团队都在叫嚣着要及早访问并准备他们的推广计划,生产率的提升将是巨大的。

例如,你可以打开一个空白Word文档,并要求Copilot根据目标数据集为客户起草一份建议书,目标数据集可以包括OneNote页面、PowerPoint幻灯片和其他办公文档,在几秒钟内,你就有了一个完整的提案。

以下是微软在发布会活动中给出的更多例子:

  • Copilot可以参加你的Teams会议,实时总结正在讨论的内容,捕捉行动项目,并告诉你哪些问题在会议中未得到解决。
  • Outlook中的Copilot可以帮助你对收件箱进行分类、确定电子邮件的优先顺序、汇总主题并为你生成回复。
  • Excel中的Copilot可以分析原始数据,为你提供见解、趋势和建议。

Microsoft 365 Copilot的工作原理

以下是Copilot提示处理方式的简单概述:

  • 用户在Word、Outlook或PowerPoint等应用程序中输入提示。
  • 微软根据用户的M365权限收集用户的业务环境。
  • 向LLM(如GPT4)发送提示以生成响应。
  • 微软执行负责任的AI后处理检查。
  • 微软向M365应用程序返回一个响应和命令。

Microsoft 365 Copilot的安全模型

在微软,生产力和安全性之间总是存在着极端的紧张关系。

这一点在冠状病毒期间表现得淋漓尽致,当时IT团队在没有完全了解底层安全模型如何工作或组织的M365权限、组和链接策略如何形成的情况下,就迅速部署了Microsoft Teams。

好消息是:

  • 租户隔离。Copilot仅使用来自当前用户的M365租户的数据,AI工具不会显示来自用户可能是访客的其他租户的数据,也不会显示可能设置了跨租户同步的任何租户的数据。
  • 培训范围。Copilot不会使用你的任何业务数据来培训Copilot为所有租户使用的基础LLM,你不用担心你的专有数据会出现在其他租户的其他用户的回复中。

坏消息是:

  • 权限。Copilot显示个人用户至少具有查看权限的所有组织数据。
  • Copilot生成的内容不会继承Copilot响应来源的文件的MPIP标签。
  • Copilot的回应不能保证100%真实或安全,人类必须对审查AI生成的内容负责。

让我们把缺点一个接一个地详细说出来。

权限

如果公司能够轻松地在Microsoft 365中强制实施最低特权,那么将Copilot访问权限仅授予用户可以访问的内容将是一个很好的想法。

微软在其Copilot数据安全文档中指出:

请务必使用Microsoft 365服务中提供的权限模式(如SharePoint),以帮助确保正确的用户或组能够正确访问企业中的正确内容。

然而,我们从经验上知道,大多数企业都远远谈不上享有最低特权,看看微软自己的云权限状态风险报告中的一些统计数据就知道了。

这张图片与我们每年对使用Microsoft 365的公司执行数千次数据风险评估时Varonis看到的情况相吻合。在我们的报告中,我们发现M365租户平均拥有:

  • 4000多万个唯一权限
  • 11.3万多条公开共享的敏感记录
  • 27K+共享链接

这一切为什么要发生?Microsoft 365权限极其复杂,只需考虑一下用户可以访问数据的所有方式:

  • 直接用户权限
  • Microsoft 365组权限
  • SharePoint本地权限(具有自定义级别)
  • 访客访问
  • 外部访问
  • 公众通道
  • 链接访问(任何人、组织范围内、直接访问、访客)

更糟糕的是,权限主要掌握在最终用户手中,而不是IT或安全团队。

标签

微软在很大程度上依赖敏感标签来执行DLP策略、应用加密和广泛防止数据泄露,然而,在实践中,让标签发挥作用是困难的,特别是如果你依赖人类来贴敏感标签的话。

微软描绘了一幅美好的图景,将标签和屏蔽作为数据的最终安全网,现实揭示了一种更糟糕的情景,随着人类创造数据,标签往往落后或过时。

阻止或加密数据可能会增加工作流的摩擦,而标记技术仅限于特定的文件类型,一个企业拥有的标签越多,它对用户来说就越令人困惑,对于较大的企业来说,这一点尤其强烈。

当AI生成更多需要准确和自动更新标签的数据时,基于标签的数据保护的效率肯定会下降。

我的标签没问题吧?

Varonis可以通过扫描、发现和修复以下内容来验证和改进组织的Microsoft敏感度标签:

  • 没有标签的敏感文件
  • 标签不正确的敏感文件
  • 带有敏感标签的非敏感文件

人类

AI可以让人类变得懒惰,像GPT4这样的LLM生成的内容不仅很好,而且很棒,在许多情况下,速度和质量都远远超过了人类的能力,因此,人们开始盲目信任AI来创造安全和准确的响应。

我们已经看到了现实世界中的场景,在这些场景中,Copilot为客户起草了一份建议书,其中包括属于完全不同客户的敏感数据,用户快速扫一眼(或不扫一眼)后点击“发送”,现在你就有了隐私或数据泄露的场景。

让你的租户安全-为Copilot做好准备

在你的Copilot推出之前,对你的数据安全态势有一个感觉是至关重要的。现在,Copilot已基本可用,现在正是设置安全控制的好时机。

最好的方法是从免费的风险评估开始,只需几分钟即可完成设置,一两天之内,你就可以实时了解敏感数据风险。

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/125131.html<

(0)
运维的头像运维
上一篇2025-02-23 14:49
下一篇 2025-02-23 14:50

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注