网站图标 专家数码

阅读思想和人工智能:非侵入性的脑文本解码和传感器对元AI的深度学习体系结构

阅读思想和人工智能:非侵入性的脑文本解码和传感器对元AI的深度学习体系结构

阅读思想和人工智能:非侵入性脑文本解码和传感器对元图的深度学习体系结构:xpert.digital.digital

人机互动的未来现在是大脑信号作为交流的关键

大脑文本解码技术:非侵入性和侵入性方法之间的比较

将思想转化为文本的能力代表了人类计算机互动中的革命进步,并具有从根本上改善沟通障碍者的生活质量的潜力。元AI的非侵入性Brain2Qwerty技术和侵入性电视学(ECOG)旨在通过直接从大脑信号解码语言意图来实现这一目标。尽管两种技术都追求相同的总体目标,但它们的方法,优势和缺点在根本上有所不同。这种全面的比较阐明了非侵入性方法的决定性优势,而无需降低侵入性程序的作用和益处。

安全性概况和临床风险:至关重要的差异

非侵入性和侵入性大脑计算机界面(BCIS)之间最严重的差异在于您的安全性和相关的临床风险。这一方面至关重要,因为它显着影响了这些技术的可访问性,适用性和长期接受。

避免神经外科并发症:无创的不可否认的优势

电皮质学(ECOG)需要一种神经外科手术,其中电极阵列直接植入了大脑表面,即硬脑膜母乳(外脑皮肤)。这种干预措施虽然在专业中心进行例行进行,但仍有固有的风险。统计数据表明,通过这种干预措施,严重并发症的风险为2%至5%。这些并发症可能包括广泛的范围,包括:

颅内出血

头骨内的出血,例如硬膜下血肿(硬脑膜和蛛网膜之间的血液积累)或脑内出血(直接在脑组织中出血),可能是由手术本身或电极的存在引起的。这些出血会导致大脑压力增加,神经系统缺陷,甚至在严重的情况下甚至死亡。

感染

每种手术干预都会构成感染的风险。在ECOG植入中,可能会发生伤口感染,脑膜炎或脑组织(脑膜炎)。这种感染通常需要侵略性抗生素治疗,在极少数情况下,可能导致永久性神经系统损害。

神经失败

尽管ECOG植入的目的是改善神经功能,但干预本身或电极的放置可能导致新的神经系统缺陷。这些可以以弱点,敏感性,语言障碍,癫痫发作或认知障碍的形式表现出来。在某些情况下,这些失败可能是暂时的,但是在其他情况下,它们可以永久保留。

麻醉相关并发症

ECOG植入通常需要全身麻醉,这也与自身的风险有关,包括过敏反应,呼吸道问题和心血管并发症。

相比之下,基于MEG/EEG的META AI方法完全消除了这些风险。使用这种非侵入性方法,传感器在头皮上附着,类似于常规的脑电图检查。无需手术干预,上述所有并发症将消除。用35名受试者进行的Brain2Qwerty系统的临床研究没有任何副作用。这强调了非侵入性方法的出色安全性。

长期稳定性和硬件故障:慢性应用的优势

关于临床适用性的另一个重要方面是系统的长期稳定性和硬件故障的风险。在ECOG电极的情况下,有风险,您会通过组织限制或电降解随着时间的流逝而失去功能。研究表明,ECOG电极的寿命约为2至5年。在此之后,可能需要交换电极,这需要进行另一种手术干预和相关风险。此外,总是存在突然的硬件故障可能会突然结束系统功能的可能性。

由Meta AI开发的非侵入性系统在这方面具有明显的优势。由于传感器是外部附着的,因此它们不受与植入电极相同的生物采矿过程的约束。原则上,非侵入性系统提供无限的维护周期。如果需要,则可以在不需要入侵程序的情况下交换或升级组件。这种长期稳定对于慢性应用特别重要,尤其是在锁定综合征或其他依赖永久通信解决方案的慢性瘫痪状态的患者中。需要重复手术干预措施以及硬件故障的风险会大大损害这些患者的生活质量,并限制对长期应用的入侵系统的接受。

信号质量和解码性能:差异比较

尽管安全性是非侵入性方法的不可否认的优势,但信号质量和由此产生的解码性能是一个更复杂的领域,在该领域中,侵入性和非侵入性方法都具有其优点和劣势。

相比之下,空间时间分辨率:精度与非侵入性

将电极直接放置在大脑皮层上的ECOG系统提供了出色的空间和时间分辨率。 ECOG的空间分辨率通常在1至2毫米的范围内,这意味着它们可以从大脑的很小和特定区域捕获神经活动。时间分辨率也很棒,大约为1毫秒,这意味着ECOG系统可以精确记录非常快速的神经事件。该高分辨率使ECOG系统能够达到临床验证的字符错误率(CER)小于5%。这意味着用基于ECOG的BCI生成的100个字符的错误少于5个错误。这种高精度对于有效和液体通信至关重要。

Brain2Qwerty是元AI的非侵入性系统,目前通过磁脑电图(MEG)达到19%至32%的误差。尽管与ECOG相比,这是更高的错误率,但重要的是要强调使用不包含手术风险的非侵入性方法实现这些值。 MEG的空间分辨率在2至3毫米的范围内,其范围比ECOG低一些,但仍足以捕获相关的神经信号。 MEG的时间分辨率也非常好,并且位于毫秒范围内。

但是,Meta AI取得了相当大的进步,以提高非侵入性系统的信号质量和解码性能。这些进展基于三个基本创新:

CNN变压器混合体系结构

这种高级体系结构结合了卷积神经网络(CNN)和变压器网络的优势。 CNN在从MEG和EEG记录的神经元活性的复杂模式中提取空间特征特别有效。您可以在数据中识别与语言意图解码相关的数据中的本地模式和空间关系。另一方面,变压器网络在学习和使用语言环境方面非常出色。您可以对跨距离的单词和句子之间的关系进行建模,从而改善基于上下文的语言意图的预测。这两个架构在混合模型中的结合使得有效地使用空间特征和语言环境,以提高解码精度。

WAV2VEC集成

WAV2VEC的集成是一种自我监视的语言表示模型,代表了另一个重要的进展。通过将WAV2VEC集成到Brain2QWerty系统中,可以将神经元信号与这些预制语言表示。这使系统能够更有效地学习神经元活动与语言模式之间的关系,并提高解码精度。自我监控的学习特别有价值,因为它减少了对大量标记的训练数据的需求,这些数据通常很难获得神经科学。

多传感器融合

Brain2Qwerty通过融合MEG和高密度脑电图(HD-EEG)来使用协同效应。 MEG和EEG是互补的神经生理测量技术。 MEG测量由神经活动产生的磁场,而脑电图测量头皮上的电势。 MEG具有更好的空间分辨率,并且不易通过颅骨伪像,而脑电图更便宜且便携。通过记录MEG和HD-EEG数据及其合并,Brain2QWerty系统可以使用模式的优势,并进一步提高信号质量和解码性能。具有多达256个通道的HD-EEG系统可以在头皮上进行更详细的电活动记录,并补充MEG的空间精度。

认知解码深度:超越运动技能

非侵入性系统(例如Brain2Qwerty)的主要优点在于它超越运动皮层活动的纯度测量以及记录更高语言过程的能力。 ECOG,特别是放置在运动区域的ECOG主要测量与语言的运动版本有关的活动,例如语音肌肉的运动。另一方面,通过使用MEG和EEG,Brain2Qwerty也可以从其他参与更复杂语言过程的大脑区域中记录活动,例如:

通过语义预测对打字滑翔机进行校正

Brain2Qwerty能够通过使用语义预测来纠正键入错误。该系统分析输入的单词和句子的上下文,并可以识别并正确纠正错误。这大大提高了液体和通信的准确性。这种预测语义的能力表明,该系统不仅可以解码运动意图,而且还对语言的语义内容有了一定的理解。

重建培训集外的完整句子

Brain2Qwerty的一个非凡特征是它可以重建完整句子的能力,即使这些句子未包括在原始培训数据集中。这表明系统的概括能力超出了模式的记忆。该系统似乎能够学习潜在的语言结构和规则,并将其应用于新的和未知的句子。这是迈向更自然,更灵活的大脑文本接口的重要一步。

检测抽象语言意图

在第一批研究中,Brain2QWerty表明,在未经验的受试者中检测抽象语言意图的准确性为40%。抽象语言意图与总体交流意图有关,该意图是“我想问一个问题”,“我想表达我的意见”或“我想讲述一个故事”之类的声明。识别此类抽象意图的能力表明,非侵入性BCI不仅能够解码将来的单个单词或句子,还可以理解用户的总体交流意图。这可以为更自然和面向对话的人类计算机相互作用树立基础。

重要的是要注意,非侵入性系统的解码性能尚未达到侵入性ECOG系统的水平。 ECOG在解码的精确度和速度方面仍然是优越的。但是,非侵入性信号处理和深度学习的进展正在不断缩小这一差距。

可伸缩性和应用范围:可访问性和成本效率

除了安全性和解码性能外,可伸缩性和应用宽度在脑文本解码技术的广泛接受和社会利益中起着至关重要的作用。在这一领域,非侵入性系统比侵入性方法具有显着优势。

成本效率和可及性:减少障碍

影响技术的可伸缩性和可访问性的一个重要因素是成本。由于需要手术干预,专门的医疗设备和高素质的员工,ECOG系统与相当大的成本相关。 ECOG系统的总成本(包括植入和长期监控)约为250,000欧元或更多。这些高成本使ECOG系统无法承受宽度质量,并将其应用于专业的医疗中心。

相比之下,具有MEG基于MEG解决方案的Meta AI Brain2QWerty的目标降低了成本。通过使用非侵入性传感器以及MEG设备串联生产的可能性,其目的是将每个设备的成本降低到小于50,000欧元。这种相当大的成本差异将使更多人可以访问非侵入性BCIS。此外,在非侵入性系统的情况下,不需要专门的神经外科中心。该应用程序可以在更广泛的医疗设施甚至家庭环境中进行。这是护理农村地区的决定性因素,也是为世界各地人民平等获得这项技术的保证。较低的成本和更大的非侵入性系统的可访问性有可能使专业和昂贵的治疗的脑文本解码技术成为更广泛,更实惠的解决方案。

自适应推广性:个性化与标准化

可伸缩性的另一个方面是系统的适应性和概括性问题。 ECOG模型通常需要为每个患者进行个人校准。这是因为ECOG电极记录的神经元信号在很大程度上取决于大脑的单个解剖结构,电极的放置和其他患者特异性因素。单个校准可能是耗时的,每位患者最多需要40个小时的培训。这种校准工作代表了广泛使用ECOG系统的重大障碍。

Brain2QWerty遵循不同的方法,并使用转移学习来减少对精心设计的个人校准的需求。该系统经过MEG/EEG数据对大量数据记录进行了培训,该数据由169人收集。这种预培训的模型已经包含了神经元信号和语言意图之间关系的广泛知识。对于新受试者,仅需要2至5小时的短期调整阶段才能使该模型适应相应用户的各个特点。这个简短的调整阶段使最大努力的最大解码性能的75%。转移学习的使用可以显着更快,更有效地对非侵入性系统进行调试,从而有助于可扩展性和应用宽度。将预培训模型转移到新用户的能力是非侵入性BCI的主要优势。

道德和监管方面:数据保护和批准渠道

脑文本解码技术的开发和应用提出了必须仔细考虑的重要道德和监管问题。在该领域的侵入性和非侵入性方法之间也存在差异。

通过有限的信号收益率数据保护:隐私保护

与BCIS有关的经常讨论的道德方面是数据保护和操纵思想的可能性。侵入性的ECOG系统,可以直接访问大脑活动可能会带来更高的滥用大脑数据的风险。原则上,ECOG系统不仅可以用于解码语言意图,还可以通过闭环刺激来记录其他认知过程,甚至可以通过封闭的刺激来操纵思想。尽管当前的技术远非这种情况,但重要的是要关注这些潜在的风险并制定合适的保护措施。

Brain2QWerty和其他非侵入性系统仅限于被动记录电动机意向性信号。该体系结构旨在滤除自动非语言活动模式。梅格和脑电图被头皮和嘈杂所捕获的信号使其在技术上苛刻,提取了详细的认知信息甚至操纵思想。非侵入性方法的“有限信号产量”可以视为保护隐私。但是,重要的是要强调,非侵入性BCI还提出了道德问题,尤其是在数据保护,澄清后同意以及可能滥用技术方面的同意。制定道德准则和监管框架条件,以确保负责使用所有类型的BCIS。

医疗设备的批准路径:使用更快

批准医疗设备的监管方式是另一个重要因素,它影响了将新技术引入临床实践的速度。侵入性ECOG系统通常被归类为高风险医疗设备,因为它们需要手术干预并可能引起严重的并发症。因此,批准ECOG系统需要大量的长期安全数据进行详细的III期研究。此批准过程可以持续数年,并且需要大量资源。

另一方面,非侵入性系统可能具有更快的入院路径。在美国,基于现有脑电图/MEG设备的非侵入性系统可以得到食品和药物管理局(FDA)的510(k)过程。 510(k)过程是对已经批准的产品“基本上等效”的医疗设备的简化入学路径。这种更快的入院路径可以使非侵入性的脑文本解码技术更快地获取临床应用并更早地使患者受益。但是,重要的是要强调,即使对于非侵入性系统,也需要严格的安全性和有效性证据才能获得批准。 BCIS的监管框架是一个发展中的领域,重要的是,监管机构,科学家和行业共同努力,共同开发清晰,适当的批准渠道,促进创新,同时确保患者的安全。

非侵入性方法的限制:仍然存在技术挑战

尽管非侵入性脑文本解码系统具有许多优势,但也必须认识到现有的技术障碍和限制,这一点很重要。必须解决这些挑战,以利用非侵入性BCI的全部潜力。

真实 - 时间延迟

Brain2Qwerty和其他非侵入性系统目前在解码方面的延迟较高,而不是侵入性的ECOG系统。 Brain2QWerty仅在句子结束后解码语言意图,这导致延迟约5秒。相比之下,ECOG系统的潜伏期大约为200毫秒,这几乎可以实时通信。非侵入性系统的延迟较高是由于更复杂的信号处理以及分析较弱和更冷冻的信号的需求。减少潜伏期是进一步发展非侵入性BCI的重要目标,以实现更多的流动性和更自然的交流。

运动工件

MEG系统对运动工件非常敏感。即使是轻微的头部移动也会显着破坏测量结果并影响信号质量。因此,基于MEG的数据采集通常需要固定的头部位置,这限制了移动应用程序。尽管脑电图不太容易受到运动伪影的影响,但肌肉运动和其他伪影也会影响信号质量。为伪影抑制的鲁棒算法的开发以及便携式和耐受性的MEG和EEG系统的开发是扩大非侵入性BCI的应用宽度的重要研究领域。

患者兼容性

基于尖端交流信号解码的非侵入性系统可以(AS)在强烈萎缩性摩托车的患者中达到限制,例如在肌萎缩性侧面硬化症晚期的患者中。在这种情况下,基于电动机意向的解码可能会失败,因为与尖端运动相关的神经元信号太弱或不再存在。对于这些患者群体,可能需要替代性非侵入性方法,例如基于认知语言过程的解码或其他方式(例如眼睛控制)。此外,重要的是要考虑到大脑活动的个体差异以及不同人之间的信号质量的变化,以使更广泛的患者人群可以使用非侵入性BCIS。

神经假想中的互补作用:共存和收敛性

尽管现有的技术挑战和侵入性ECOG系统的卓越精度,但元AI和其他研究人员的非侵入性方法彻底改变了对神经假体领域的早期干预。非侵入性BCI提供了一个优势,即可以使用低风险,并且可以在疾病开始时使用。他们可以在早期阶段为患者提供沟通困难的开始,从而提高他们在早期阶段的生活质量和参与社交生活的质量。

目前,ECOG系统对于完全瘫痪的患者(尤其是锁定综合征)的高精度应用仍然是不可替代的,其中最大的解码准确性和实时交流至关重要。对于这个患者组,侵入性BCI的潜在优势证明了更高的风险和成本是合理的。

大脑计算机界面的未来可能是两种技术之间的融合。结合非侵入性和侵入性方法优势的混合系统可能会预示神经假想的新时代。例如,这种混合方法可以使用硬膜外微电极比ECOG电极侵入性较小,但仍然比非侵入性传感器提供更高的信号质量。结合用于信号处理和解码的高级AI算法,这种混合系统可以缩小侵入性和准确性之间的差距,并启用更广泛的应用。非侵入性和侵入性的脑文本解码技术的持续进一步发展以及混合方法的研究有望在未来,在这种未来中,具有通信障碍的人可以使用有效,安全且可访问的通信解决方案。

适合:

 

您的全球营销和业务发展合作伙伴

☑️我们的业务语言是英语或德语

☑️ 新:用您的国家语言进行通信!

 

康拉德·德军总部

我很乐意作为个人顾问为您和我的团队提供服务。

您可以通过填写此处的联系表,或者直接致电+49 89 89 674 804 (慕尼黑)。我的电子邮件地址是: wolfenstein xpert.digital

我很期待我们的联合项目。

 

 

☑️ 为中小企业提供战略、咨询、规划和实施方面的支持

☑️ 创建或调整数字战略和数字化

☑️国际销售流程的扩展和优化

☑️ 全球数字 B2B 交易平台

☑️ 先锋业务发展/营销/公关/贸易展览会

退出手机版