网站图标 专家数码

基于人工智能的知识工作:来自OpenAAI的Chatgpt进行深入研究:优点和限制在哪里?

基于人工智能的知识工作:来自OpenAAI的Chatgpt进行深入研究:优点和限制在哪里?

基于人工智能的知识工作:来自OpenAAI的Chatgpt进行深入研究:优点和限制在哪里? - 图像:XPERT.DIGITAL

Openaai与竞赛:“深入研究”如何塑造工作的未来

深度研究:OpenAI打开访问并改变知识工作的景观

随着他的“深入研究”功能的逐步开放,Openaai迈出了一个了不起的一步,有可能从根本上改变我们知识的方式。现在,曾经为一组专业人士提供的保留的东西现在可以提供给更广泛的受众,包括Chatgpt Plus,团队,教育和企业计划的订阅者。这种访问的扩展,尽管具有每月使用限制,但不仅发出了这项技术的成熟度的提高,而且还表示OpenAI的战略野心,在基于AI的信息系统的高度竞争性领域中发挥了领导作用。步骤发生在与困惑,Google,XAI和Microsoft等公司的竞争加剧的时候,所有这些都努力开发下一代知识工作工具。

深入研究的背景和功能

创世纪和核心功能

深入的研究来自克服常规搜索方法的局限性并启动获得知识的新时代。它被设计为一种能够自主进行复杂的多阶段研究的“ AI代理”。从本质上讲,它不仅要找到信息,而且要以结构化的形式理解,分析和展示信息。 Deep Research使用OpenAI的O3模型的高度开发版本,该版本已专门针对Web浏览和数据分析的苛刻任务进行了优化。

与传统的聊天机器人模式(例如GPT-4O中使用的聊天机器人模式)相反,深入的研究旨在在较长的时间段内按照五到三十分钟的要求进行操作。在此期间,它系统地搜索了数百个在线资源,提取相关信息,在提出问题的上下文中解释其重要性,并将结果综合为一致的报告。这个过程远远超出了搜索结果的简单访问。它包括对发现的材料,模式,矛盾和相关连接的积极检查。

技术基础

深度研究的表现是基于不同高级AI技术的组合。一个中心方面是“推理”,即得出逻辑结论和理解复杂事实的能力。这使系统能够独立制定和调整搜索策略,批判性评估来源并在相应问题的背景下评估信息的相关性。

此外,深入研究能够执行Python代码,这为直接数据分析打开了大门。在处理大型数据记录,进行统计分析或进行复杂的计算方面,这种能力特别有价值。另一个重要的构件是处理自定义文件的能力。用户可以提供系统文档,表或其他文件格式,然后将其包含在研究中。例如,这使得能够将内部报告,研究数据或特定文档集成到分析中,从而扩大研究背景。

与以前的模型有决定性的区别在于培训方法。深入的研究是通过“强化学习”培训的,因此,重点是需要浏览器和工具使用的实际任务。这种方法从根本上与纯粹基于文本的培训方法有所不同,该方法在许多以前的语言模型中很常见。通过培训真实的研究任务,深入的研究学会了有效地处理互联网的动态且通常是非结构化的信息空间。

扩展访问和使用条款

新的用户组和碎屑限制

扩大对更广泛的用户组的深入研究的扩展标志着这项技术民主化的重要一步。最初专门用于Pro用户,每月订阅200美元,访问将于2025年2月25日扩展到以下用户组:

加上用户(每月20美元)

每月10个深度审查查询。这使广泛的用户能够体验深度研究的基本优势,而不必承担较高的专业订阅成本。

团队/企业/教育

每个用户和月份10个查询。该法规旨在为组织和教育机构提供访问,并促进团队中深入研究的合作使用。

专业用户

增加100至120个查询的每月挠度。对于定期进行广泛研究的电力用户来说,这是容量的可喜增加。

资源密集型处理:精度与效率之间的平衡

这些交错的用法限制反映了深入研究的资源强度。每个查询都与大量的计算费用相关联,因为该模型最多可自动工作30分钟,可以制定搜索策略,评估来源和三角洲的结果。因此,查询的局限性可以有效地管理系统资源,并确保所有用户的服务质量始终如一。

扩展过程中的技术改进

与用户组的扩展同时,还实施了技术改进,这进一步提高了深入研究的功能和用户的友好性:

1。带引号的嵌入式图像

现在,来自Web来源的视觉内容直接集成到报告中,并与相应的来源一起提供。这丰富了视觉信息的报告,并促进了对复杂事实的理解,尤其是在科学,技术或设计等领域。

2。改进的文档分析

深度研究现在对上传文件,尤其是PDF和表有更好的了解。这在特定于主题的环境中尤其有利,在这些环境中,用户经常使用专业文档。改进的分析能力使得可以更精确地从这些文档中提取信息并将其集成到研究结果中。

3。透明度提高

深入研究创建的每个报告都包含详细的来源和进行研究步骤的摘要。这增加了研究过程的可理解性,并使用户能够更好地评估结果的信誉。透明度是增强对AI支持的知识工作并促进该技术负责使用的重要方面。

实践中的性能和应用

基准结果和性能比较

在各种内部和外部测试中证明了深入研究的表现。在与包括GPT-4O和Claude 3.5在内的其他模型的直接比较中,深入的研究显然超过了各种基准:

人类的最后考试(CAI/Scale AI)

在测试AI系统的一般知识和解决问题技能的苛刻基准中,深入研究的准确性为26.6%。为了进行比较:GPT-4O和Claude 3.5仅达到9%。该结果强调了深层研究的卓越理解复杂问题并提供精确答案的能力。

盖亚基准

在测试AI系统在各个知识领域回答问题的能力的Gaia基准测试中,深入的研究领先于50个任务类别中的43个。这证明了不同领域深入研究的广泛适用性和高性能。

重编程研究

在生物医学研究领域的特定应用中,深入研究被成功地用于分析200多个细胞重编程的研究,以在不到30分钟的时间内进行重新编程。传统上使用数天甚至几周的这项任务可以在最短的时间内通过深入研究来掌握。这说明了技术加速研究过程的巨大潜力。

竞争格局和战略定位

竞争解决方案和独特的卖点

Openai故意对基于AI的知识工作领域日益增长的竞争进行了深入的研究。市场上有各种替代解决方案提供相似的功能,但在某些方面有所不同:

谷歌深度研究

集成在Gemini Advanced(也可每月20美元)。借助Gemini Advanced,Google提供了一种可比的解决方案,该解决方案也依赖于深层研究功能。 Openaai和Google之间的竞争正在推动这一领域的创新,并导致可用技术的稳步改进。

Xai DeepSearch

专门用于Grok用户(每月$ 8)。埃隆·马斯克(Elon Musk)的公司Xai提供了另一种替代方案,该探索与Grok订阅有关。这表明,AI市场中的各种参与者采取了不同的策略来定位和销售其技术。

微软更深入地思考

免费可用,但无需WebBrows功能。有了更深入的思考,微软提供了一个免费的解决方案,该解决方案在其功能上受到限制,因为它无法访问Internet。这清楚地表明,网络浏览的能力是深层研究工具的决定性区别。

不同解决方案之间的显着差异在于“代理能力”。尽管Microsoft的Think更深层次仅限于静态数据记录,但OpenAI和Google的系统能够在Web上独立研究并动态访问新信息。这种创建自主信息和处理的能力是深入研究的核心优势,并将其与更简单的搜索工具区分开来。

困惑深度研究

困惑深度研究表现为一个基于AI的免费研究平台,该平台使用户可以快速互动地访问广泛的当前信息来源。与传统的搜索工具相反,困惑特别重要地对来源的透明表示以及在上下文相关的方式回答复杂问题的能力。通过使用高级算法,该平台可以从网络中提取动态相关的数据并实时满足用户的信息需求。自主网络研究和结果的精确处理的这种结合使整体研究成为一种有吸引力的工具,尤其是对于那些也欣赏良好基础和可理解信息的用户。此外,该平台的互动性使得可以在对话框中直接澄清以下问题,从而支持迭代研究过程。

经济影响和市场战略

OpenAI的价格差异为20美元的加上订阅,并以200美元的价格订阅了Pro订阅,这是一个战略性的举动,旨在解决范围广泛的用户群体并绑定高性能用户。更实惠的Plus选项使大量的受众能够了解并使用深入研究的优势,而专业订阅则针对需要广泛研究并且需要扩展功能的专业用户量身定制。

像Abi Research的Paul Schell这样的分析师认为,这一发展是一种“民主化代理人” AI的明确趋势。深入研究和类似技术的更广泛的可用性有可能从根本上改变知识工作并为公司和个人打开新的机会。同时,这一发展还包含了传统知识工作者的破坏性影响,他们的任务越来越多地被AI系统接管。有效地使用AI支持的工具并进行批判性评估其结果的能力将成为知识工作者的关键能力。

安全和风险管理

幻觉率和对错误的易感性

尽管研究令人印象深刻,但重要的是要考虑到这项技术的限制和潜在风险。 Openai本人承认,深入的研究可以在3-5%的案件中得出错误的结论,或者无法正确评估权威来源。这些“幻觉”或错误可能有不同的原因,例如训练数据集,算法弱点或要处理的信息的固有复杂性。

Openai的内部白皮书特别警告以下潜在的错误来源:

误解监管指南

深入研究可能难以解释和应用复杂的法律,法规或合规指南。在金融或医疗保健等高度监管的行业中,这尤其有问题。

事实和谣言之间的区别不足

在互联网的动态信息室中,通常很难区分安全的事实和未经证实的谣言或意见表达。在某些情况下,在他的报告中,深入的研究可能很难可靠地和可能不正确或误导性信息。

不确定性交流的限制

AI系统通常很难在其陈述中传达不确定性和概率。在某些情况下,深入的研究可以给人以这样的印象,即它的结果绝对是安全和完美的,尽管实际上并非总是如此。

安全措施和质量保证

为了最大程度地降低风险并确保深入研究的安全性,Openai采取了各种措施:

1。红色队伍运动

外部安全专家和“红色团队”被委托在深入研究中寻找弱点和潜在的虐待。这些测试包括12种不同的风险类别,包括数据保护,危险建议分配,歧视和操纵。这些运动的结果帮助Openai确定了漏洞并改善了安全预防措施。

2。自动评估

OpenAI依靠自动评估系统,以不断监视深度研究的质量和安全性。根据他们自己的信息,这些系统在检测不良内容(例如仇恨言论,宣传或有害信息)中获得了93%的准确性。

3。沙箱

深度研究中的Python代码是在孤立的“沙盒”环境中进行的。这样可以防止潜在的有害代码访问整体系统或导致不良的副作用。沙箱是一种常见的安全技术,可最大程度地减少恶意软件或系统损害的风险。

未来的发展和开放问题

计划的功能和扩展

Openaai已经宣布,将在未来几个月内进一步发展深入的研究,并扩展到包括新功能。计划在2025年第二季度进行以下扩展名:

多模式报告

数据可视化和生成图像的整合到深度研究中的报告中。这旨在进一步提高报告的清晰度和有意义,并使用户能够一眼记录复杂的信息。

API访问

为选定的企业合作伙伴提供编程接口(API)。这将使公司能够将深入的研究直接集成到自己的系统和应用程序中,并适应特定应用的技术。但是,OpenAI强调,只有在充分澄清“说服风险”之后,API批准才会发生。这表明Openai非常认真地承担深入研究的潜在风险,尤其是在操纵和虚假信息方面。

动态的自由式限制

引入了针对团队用法依赖性缩放。这可能意味着深入研究使用的团队可以接收更灵活的Deflagen Simits或增加其他能力。对使用限制的动态适应将使整合其工作流程的深入研究变得更加容易。

无法解释的挑战和研究需求

尽管取得了令人印象深刻的进展,但仍然存在与一般研究和基于AI的知识工作有关的开放问题和挑战。例如,批评家质疑当前的引文机制是否符合科学标准。科学文献分析的一项案例研究表明,深入研究正确地引用了相关研究,以分析87%的案例OCT4蛋白质修饰,但在13%的病例中产生了过时或无关的来源。这个示例清楚地表明,质量保证和对AI系统结果的批判性评估必须继续发挥重要作用。

这个问题还保持开放,深入研究的更广泛可用性将如何影响工作世界和知识工作者的作用。凯文(Kevin)预测,深入研究会真正改变“每周工作”,因为它可以预测?还是证明是另一个具有有限实际好处的AI工具?这些问题的答案将在很大程度上取决于公司和个人如何适应这一技术并将其整合到他们的工作过程中。但是,可以肯定的是,基于代理的研究的时代已经开始,我们知道知识的方式将在根本上改变。

基于AI的知识工作的转折点

对更广泛的受众的深入研究的开放标志着基于AI的知识工作的转折点。该工具为前所未有的效率提高和获得知识的新机会提供了研究人员,分析师和知识工作者。同时,关于质量保证,道德责任和对工作世界的影响的重要问题仍然存在。 Openaai的决定,最初的研究最初不是通过API提供的,它强调了该公司经过的潜在滥用风险和负责任地开发该技术的经过精心处理的公司。对于组织而言,此类工具的整合越来越成为一个竞争因素,只要它们开发了对结果进行批判性评估并使用该技术的必要技能。接下来的几个月和几年将表明深入研究是否实际上有可能改变知识工作并启动基于AI的知识获取的新时代。

 

🎯🎯🎯 受益于 Xpert.Digital 全面服务包中广泛的五重专业知识 | 研发、XR、PR 和 SEM

AI 和 XR 3D 渲染机:Xpert.Digital 在综合服务包、研发 XR、PR 和 SEM 中提供五重专业知识 - 图片:Xpert.Digital

Xpert.Digital 对各个行业都有深入的了解。 这使我们能够制定量身定制的策略,专门针对您特定细分市场的要求和挑战。 通过不断分析市场趋势并跟踪行业发展,我们可以前瞻性地采取行动并提供创新的解决方案。 通过经验和知识的结合,我们创造附加值并为客户提供决定性的竞争优势。

更多相关信息请点击这里:

 

我们随时为您服务 - 建议 - 规划 - 实施 - 项目管理

☑️ 为中小企业提供战略、咨询、规划和实施方面的支持

☑️ 创建或调整数字战略和数字化

☑️国际销售流程的扩展和优化

☑️ 全球数字 B2B 交易平台

☑️ 开拓业务发展

 

康拉德·德军总部

我很乐意担任您的个人顾问。

您可以通过填写下面的联系表与我联系,或者直接致电+49 89 89 674 804 (慕尼黑)

我很期待我们的联合项目。

 

 

写给我

 
Xpert.Digital - 康拉德德军总部

Xpert.Digital 是一个专注于数字化、机械工程、物流/内部物流和光伏的工业中心。

凭借我们的360°业务发展解决方案,我们为知名企业提供从新业务到售后的支持。

市场情报、营销、营销自动化、内容开发、公关、邮件活动、个性化社交媒体和潜在客户培育是我们数字工具的一部分。

您可以通过以下网址了解更多信息: www.xpert.digital - www.xpert.solar - www.xpert.plus

保持联系

退出手机版