快捷搜索:

我使用 ChatGPT 审计代码发现了 200 多个安全漏洞(

我使用ChatGPT审计代码发现了200多个安全漏洞(GPT-4与GPT-3对比报告)

  前面使用 GPT-4 对部分代码进行漏洞审计,后面使用 GPT-3 对 git 存储库进行对比。最终结果仅供大家在 chatgpt 在对各类代码分析能力参考,其中存在误报问题,不排除因本人训练模型存在问题导致,欢迎大家对误报结果进行留言,我会第一时间跟进处理~

  大家若想看更全面的内容,请先关注我并发送私信,我会根据大家反馈写一篇 GPT-4 对某代码更全面的分析报告。

  GPT-3 在此 git 存储库中发现了 213 个安全漏洞。而相比之下,市场上很好的商业工具却只发现了 99 个安全漏洞。尽管商业工具以更结构化的格式提供上下文,在手动审查 GPT-3 检测到的 99 / 213 个漏洞的随机样本后,有 4 个是误报。代码审计大家都清楚,存在误报是常规操作。

  近年来,ChatGPT 已成为互联网新宠,长期以来一直对现代人工智能的潜在影响持怀疑态度的网络安全行业似乎也注意到了这一点,因为他们担心 ChatGPT 可能会被资源有限、技术知识为零的黑客滥用。

  目前人工智能和机器学习领域取得了巨大的发展asp学习,如此便开辟了一个新的可能性领域-基于 AI 的代码分析,如何使用 AI 模型来检测代码中的安全漏洞尤为惹人关注。

  文中使用 OpenAI 的 GPT-4对部分代码进行分析,文末针对GPT-3 如何在包含 129 个易受攻击文件的代码存储库中查找安全漏洞。如果大家感兴趣,我会单独为大家更新哦!

  GPT-4 使用 Plus 会员版本,跟官网同配置,可处理长代码。( PS:若有朋友需要开通 PLus 会员,私信留言,将提供保姆级教程和邀请码,能优惠购买哦~)

  GPT-3 变体(text-davinci-003)具有 4000 个标记的上下文窗口,大约为 3000 个英文单词。这意味着它最多可以处理几百行代码的请求,无法一次性处理整个代码库。

  为了解决这个问题,只能使用 GPT-3 扫描单文件。这意味着 GPT-3 难以找到由多个代码文件交互引起的安全漏洞,除非进行足够多的提示词引导。特别是当源代码使用常见的库,如 express.js、Flask、Python 标准库、C 标准库等时。可能 GPT-3 有相关记录。在本文分析的代码中,GPT-3对导入库有相关记录就能够准确地检测到安全漏洞,而无需检查任何导入库的代码。

  公平地说,我怀疑许多现有的商业漏洞扫描工具在进行静态分析时实际上并不检查导入库的代码,因此这与市场上某些工具的工作方式并没有太大的不同。

  被分析的代码存储库中的每个文件夹都以一种安全漏洞命名,并包含带有示例代码的文件,包含一个或多个漏洞。其中一些文件包含琐碎的代码,但许多是您可能会在生产代码库中遇到同样的代码片段(注意:尽管它们仍然是片段,因此缺乏更大代码库的上下文)。存储库中每个文件夹的 README.md 包含 GPT-3 对该文件夹中所有文件的安全漏洞的分析。

  这段代码存在一个漏洞,即通过 PHP 的 unserialize 函数,可以实现远程代码执行。具体原因如下:

  代码末尾使用了 unserialize() 函数,它可以将一个已被序列化的字符串转换回 PHP 值。在这个例子中,用户可以通过命令行参数输入一个序列化的字符串。

  通过构造一个序列化的字符串,攻击者可以创建一个 entry 类的实例,同时将其 awesome 属性指向 GiveFlag 类的实例。这样,当 entry 类的实例被销毁时常用asp代码大全下载安装苹果手机怎么下载软件,__destruct() 方法会执行 GiveFlag 类的 flag() 方法,进而执行 GiveFlag 类的 innocent() 方法。GiveFlag 类的 innocent() 方法会打开 flag.txt 文件并读取其中的内容。这样一来,攻击者就可以通过输入一个恶意构造的序列化字符串来触发代码执行,获取 flag.txt 文件的内容。

  避免使用 unserialize() 函数处理不可信的数据。可以使用其他方法(如 JSON)来传输和解析数据。

  对于具有潜在危险的魔术方法,如 __destruct(),要特别小心。确保在使用这些方法时,不会引入安全隐患。

  这段 Python 代码使用 Flask 框架实现了一个 Web 应用,用户可以设置、获取和删除提醒。但是,代码中存在一些安全问题:

  代码使用了 Python 的 pickle 模块来序列化和反序列化用户输入的数据。1.pickle 存在已知的安全风险,尤其是在处理不可信的数据时。攻击者可能通过构造恶意的 pickle 数据来执行任意代码。虽然代码中使用了 _hook_call() 函数对 pickle.loads() 进行了一定程度的安全控制,但依然不能保证绝对安全。建议使用更安全的替代方案,如 JSON。

  2.代码中使用了一个名为 SECRET_KEY 的静态密钥,这可能会导致安全隐患。为了提高安全性,可以考虑使用更强大的密钥生成策略,并定期更换密钥。

  3.使用 sha256 进行摘要计算,虽然目前没有被证明不安全,但为了提高安全性,可以考虑使用更安全的哈希算法,如 bcrypt。

  4.使用了不安全的函数,如 eval、execfile 和 os.system 等。虽然代码中定义了一个 black_type_list 来限制这些危险函数的使用,但在实际开发中,应尽量避免使用这些具有潜在安全风险的函数。

  5.代码在 app.run() 中将 host 设置为 0.0.0.0,这意味着应用将监听所有可用的网络接口。在生产环境中,这可能会导致潜在的安全问题。建议仅在开发环境下使用 0.0.0.0,生产环境应使用具体的 IP 地址或域名。

  综上所述,这段代码存在一定的安全风险。在实际应用中,需要对这些问题进行修复,并关注其他方面的安全性,如 HTTPS 连接、访问控制等。

  使用了 $_GET 方法直接接收用户输入的参数 rootUname,而没有对其进行任何过滤或验证。这可能导致安全问题,例如注入攻击。建议使用输入验证和过滤函数,如 filter_input(),来对用户输入进行安全处理。

  代码中直接将用户提供的 rootUname 用于构建命令行并执行,这可能导致命令注入攻击。攻击者可以在 rootUname 中插入恶意命令,从而导致服务器的安全问题。为了防止命令注入,建议使用参数绑定的方式执行命令,如使用 PHP 的 escapeshellarg() 函数对参数进行转义。

  代码通过 exec() 函数执行系统命令,这可能导致一定的安全风险。在实际开发中,应尽量避免使用这类可能引发安全隐患的函数。如果必须使用,应确保对输入参数进行严格的验证和过滤。

  代码直接输出错误信息,可能会暴露服务器的敏感信息。在生产环境中,建议对错误信息进行处理,避免将详细的错误信息直接输出给用户。

  综上所述,这段代码存在安全风险。在实际应用中,需要对这些问题进行修复,并关注其他方面的安全性,如 HTTPS 连接、访问控制等。

  这段代码存在一个安全问题,即 XML 外部实体(XXE)注入攻击的风险。问题出在使用 libxml_disable_entity_loader(false) 函数,它允许解析外部实体。攻击者可以通过构造恶意的 XML 输入,来读取服务器上的敏感文件或发起网络攻击。

  另外,这段代码没有对用户输入进行验证和转义,可能导致其他安全问题,例如跨站脚本攻击(XSS)。因此,在处理用户输入时,请务必进行有效的验证和转义。

  这代码比较长,大家看代码库中 XmlReader_Tests.cs,GPT-4 能处理长脚本。具有 token 长的特点。我就截图给大家看代码长度。

  这个测试代码包含三个测试用例,分别测试了使用 XmlReaderSettings 和 XmlReader 对 XML 文档的解析。我们逐个分析:

  综合分析能力:在分析代码时我能够全面地考虑各种可能的安全问题,从输入验证到敏感信息泄露等多个方面进行分析。

  动态调试与模拟执行:通过模拟代码执行过程,能够更深入地理解代码逻辑,从而发现潜在的安全风险。

  持续学习与适应:随着网络安全领域的不断发展,能够持续学习新的知识和技术,以便更好地应对各种代码的安全分析能力。

  在代码审计过程中,展现出了较强的安全意识和分析能力,并通过动态调试和模拟执行更深入地理解代码逻辑。然而,安全审计是一个复杂且持续的过程,需要不断学习和提高。

  让我们用高级语言编写的一个不那么简单的程序来试试这个,比如这个包含 Log Forging 漏洞的 C# 程序。我个人在开源项目和生产代码库中看到过类似(尽管不那么琐碎)的代码:

  2.越界读取:memcpy() 函数用于将数据从 img.data 复制到 buff1 和 buff2,而不检查目标缓冲区的大小,这可能导致越界读取。

  3.越界写入:buff3 和 buff4 数组的写入没有检查源缓冲区的大小,这可能导致越界写入。

  5.内存泄漏:如果 size3 变量大于 10,则不会释放 buff4 数组,这可能导致内存泄漏。

  GPT-3 对于其中 5 个中的 4 个是正确的。漏洞 1 是误报,因为 fopen() 在行中检查了的值 if(fp == NULL)。此外,漏洞 4 的措辞具有误导性——它引用的代码行中存在两个未初始化的内存访问错误是正确的,但它指向了错误的变量名。

  最后一个 Java 示例是我最喜欢的,因为不幸的是,当我第一次阅读这段代码时,我没有发现它有任何问题。对我来说,它看起来完全无害且熟悉——我在野外看到过类似的代码,但从未有过任何第二个想法。

  通过应用最佳安全实践并在开发人员编写和提交代码时对网络安全进行教育,人工智能代码分析可以代表网络安全的最终左移。这可以真正在组织内部培养强大的网络安全文化,甚至可以防止下一次大黑客攻击,但是……

  诚然,这项技术还不完美,它遗漏了几件事,而经验丰富的网络安全专业人员进行审计时不会遗漏的。尽管如此,作为通用的大型语言模型,它还是出奇的好,而且比其他替代方案便宜得多。

  GPT-4 目前没有发布日期,但我相信这些大型语言模型将随着获得越来越多的功能而继续向前发展。

  在手动检查 GPT-3 检测到的 213 个漏洞中的大约 60 个之后,我发现其中一个值得注意的误报位于此 Javascript 程序的第 13 行:

  GPT-3 对前两个漏洞的看法是正确的,但第三个漏洞是误报——被obj.username逃逸了,但 GPT-3 说它不是。

  实验结果表明,GPT-3 能够检测到扫描的 129 个文件中的 85 个文件中的安全漏洞。能力不亚于一个代码审计专家!

  本文介绍了使用 ChatGPT 审计代码的过程和结果。作者使用了 GPT-3 检测到了 213 个安全漏洞,其中 85 个文件被正确检测到。GPT-3 的误报率相对较低,但仍有一些漏洞被错报或漏报。作者认为,GPT-3 可以作为一种辅助工具来帮助发现安全漏洞,但不能完全取代人工审计。

  GTP-4 能处理长代码,就意味着不用将代码进行切割,不用过多引导。在代码审计过程中,展现出了较强的安全意识和分析能力,并通过动态调试和模拟执行更深入地理解代码逻辑。虽然比 GPT-3 强大许多,但还是有很长的路需要走。

  ☞Google 搜索引擎将加入 AI 聊天功能;澳洲地方市长或就诽谤信息起诉 ChatGPT;Swift 5.8 发布极客头条☞C++ 增幅一骑绝尘,“黑马” Zig 闯入前 50 名!TIOBE 4 月榜单发布☞震动硅谷!43 岁知名技术大佬当街遇刺身亡,马斯克怒批暴力犯罪

您可能还会对下面的文章感兴趣: