阿联酋阿布扎比先进技术研究委员会(ATRC)下属应用研究机构技术创新研究院(TII)宣布推出Falcon-H1阿拉伯语大模型。这款全新开发的大语言模型采用混合Mamba-Transformer架构,完全摒弃了此前基于Transformer的版本设计,目前已登顶开源阿拉伯语大语言模型排行榜(OALL),成为性能最高的系统。这一里程碑成就确立了Falcon-H1阿拉伯语作为当前领先阿拉伯语AI模型的地位,在提供顶尖准确率、上下文处理能力和语言表现力的同时,性能超越数倍于自身规模的模型。
![]()
阿联酋总统顾问、先进技术研究委员会秘书长Faisal al Bannai表示:“Falcon-H1阿拉伯语大模型体现了我们持续致力于巩固阿联酋作为先进技术和负责任AI全球枢纽地位的承诺。通过提供满足本地区语言和文化需求的模型,我们推动的创新更易于获取、更贴合实际,也更能对社会产生深远影响。这一成就充分证明了TII拥有深厚的人才储备和研究实力。”
基于今年早些时候发布的Falcon阿拉伯语模型获得的积极反馈——这些反馈凸显了阿拉伯语社区对高质量大语言模型的迫切需求——TII进一步推进研究工作,推出了全新的Falcon-H1阿拉伯语模型系列。该系列包含3B(30亿)、7B(70亿)和34B(340亿)三种参数规模,旨在满足多样化的基础设施和应用场景需求。Falcon-H1阿拉伯语大模型在数据质量、方言覆盖、长上下文稳定性和数学推理能力方面均实现了提升,能够在实际应用中更准确、可靠且上下文感知的理解阿拉伯语。
TII首席执行官Najwa Aaraj博士表示:“Falcon-H1阿拉伯语大模型的开发建立在多年阿拉伯语AI基础研究之上,直接响应了我们社区——包括开发者和企业——的需求。通过改进架构、数据质量和长上下文推理能力,我们正在创造能够在教育、医疗、治理和企业等多个领域解锁新可能性的工具,且所有这些都以阿拉伯语实现。这一模型是我们使命的重要一步,即提供服务本地区并为全球进步做出贡献的世界级AI。”
基准测试结果
在OALL排行榜上(该榜单评估模型在广泛阿拉伯语理解和推理任务中的表现)Falcon-H1阿拉伯语展现出显著的性能领先优势:
- 3B模型平均得分61.87%,领先微软Phi-4 Mini等顶尖40亿参数竞争对手10个百分点。
- 7B模型平均得分71.47%,超越所有约10B的模型,包括卡塔尔的Fanar-1-9B和沙特阿拉伯的HUMAIN ALLaM 7B。
- 34B模型得分75.36%,性能甚至超过70B+参数的系统,包括阿里云的Qwen2.5 72B和META的Llama-3.3 70B。
![]()
除OALL外,Falcon-H1阿拉伯语模型在更具针对性的基准测试中也取得了出色成绩,包括:
3LM:用于评估STEM领域推理能力
ArabCulture:用于评估文化和上下文理解能力
AraDice:用于评估方言理解能力
这些结果共同标志着阿拉伯语 AI 领域的突破时刻。 Falcon-H1 阿拉伯语不仅在通用和专业基准测试中均超越数倍于自身规模的模型,还展现了达到该领域新标杆的语言深度、推理能力和效率。这确立了 Falcon-H1 阿拉伯语作为迄今为止开发的最强大、最多样化的阿拉伯语大语言模型的地位。
TII人工智能与数字研究中心(AIDRC)首席研究员Hakim Hacid博士表示:“这一模型体现了我们专注于构建不仅更先进,而且在实际场景中真正实用的阿拉伯语AI的目标。通过提升效率、理解深度和语言覆盖范围,我们正在打造能够更好地支持本地区机构、开发者和社区的AI系统。”
该模型还大幅扩展了上下文长度,支持高达256K Tokens(词元)的上下文窗口,使模型能够在单次交互中处理大量信息。在实际应用中,这意味着用户可以分析冗长的法律文件、医疗记录、学术论文或企业知识库,而不会丢失上下文或连续性——这种大规模能力在以往是不可能实现的。
![]()
自2023年以来,TII的Falcon AI模型在地区和全球基准测试中均排名第一,如今Falcon-H1阿拉伯语在所有模型规模类别中均领先开源阿拉伯语大语言模型排行榜。这些结果证明了TII有能力构建在全球最高水平竞争的自主AI能力,同时巩固阿布扎比及整个阿联酋在阿拉伯语AI研究与创新领域的领导地位。
新模型现已通过TII的公共界面在以下平台开放使用:https://chat.falconllm.tii.ae。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.