![]()
始智AI wisemodel.cn社区是源自中国的中立开放的AI开源社区。正在,欢迎加入共同成长。wisemodel推出邀请注册奖励活动,最高可得算力券+token包380元奖励,欢迎参与和支持!
近期,科大讯飞开源了两款模型:讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly,助力前沿化学技术研究,以及声音生成技术和应用的探索。两款模型均已上线始智AI-wisemodel开源社区,欢迎大家前去体验。
![]()
模型地址
https://www.wisemodel.cn/organization/ifly_opensource
01.
讯飞星火化学大模型
该模型基于讯飞星火X1-0420大模型,在多种化学任务数据集上进行了微调,展示了在解决复杂化学问题方面的卓越能力,同时保持了强大的通用能力。该模型在与化学相关的基准测试中表现出色,并且在大多数评估指标上明显优于领先的通用模型。

Spark Chemistry-X1-13B具备以下特点:
将长思维链和快思考进行结合,是支持快思考和慢思考的统一模型。
采用新的注意力掩码机制,将不同推理模式的训练阶段进行解耦,有效防止了混合模式数据分布之间的干扰。
对高等知识问答、化学名称转换和分子性质预测等专门任务进行了多阶段优化,在相关评测上也取得了优异表现。
![]()
* 评估数据集为自建,粗体表示当前评测SOTA
* 所有模型均使用相同的评估方案进行评估,结果为大模型在不同任务上平均的Zero-shot效果
Spark-Chemistry-X1-13B能够助力化学相关科研工作的高效推进与深远探索,使得开发者能够高效便捷搭建化学性质预测、化学知识检索问答等相关应用,同时也激发了更多跨领域创新可能,例如计算机科学与化学、生物学与化学等。
02.
讯飞文生音效模型
AudioFly模型可基于文本描述输入,生成44.1kHz 采样率的高质量音频,在文本与音效的匹配度上表现优异。AudioFly采用了潜在扩散模型(LDM)架构,经海量多元声音数据训练,支持单事件、多事件场景。

这里是一些AudioFly所生成的样例:
Prompt:A cat meows, and it's drizzling(一只猫喵喵叫着,外面正下着小雨)
Prompt:thunder rumbled in the distance (远处传来阵阵雷声)
在未进行针对性微调的情况下,AudioFly在学术数据集AudioCaps测试集上取得了SOTA指标,证明了该模型良好的推广性和鲁棒性。
![]()
* 以上为在学界大规模音频事件描述数据集AudioCaps上的评测结果
FD:衡量生成音频与真实音频特征分布上的差异
KL:衡量生成结果与真实数据概率分布上的差异
CLAP:计算生成的音频与文本描述的一致性
* 基线模型的指标引用了论文 Stable Audio Open 中的评测分数;AudioFly 评测复用 Stable Audio Open 开源的测试方法保证客观性。
AudioFly的开源能够有效降低音效生成模型的使用门槛,开发者可以将其应用于短视频配音、有声故事生成等领域,释放更多声音创意潜力,创造出更多优质的声音内容。
编辑:成蕴年
----- END -----
![]()
wisemodel相关:
系列模型:
关于wisemodel更多
1
欢迎持续关注和支持
开源社区建设需要长期坚持和投入,更需要广大用户的积极参与、贡献和维护,欢迎大家加入wisemodel开源社区的志愿者计划和开源共创计划。期待更多开发者将开源成果,包括模型、数据集和代码等发布到 wisemodel.cn 社区,共建中立、开放的AI开源社区生态。欢迎扫码添加wisemodel微信,申请加入wisemodel社群,持续关注wisemodel.cn开源社区动态。
2
欢迎加盟wisemodel开源社区
始智AI wisemodel社区自2023年9月上线以来,逐渐成为影响力日益扩大的中立开放的AI开源社区,为了加快公司发展,我们长期需要技术、运营等人才加盟,技术侧重在AI infra、后端开发,熟悉K8S、模型训练和推理等技术, 以及熟悉开发者生态运营的成员,欢迎感兴趣的朋友加盟,可以通过添加wisemodel微信,或者将简历投递到邮箱:liudaoquan@wisemodel.cn
3
欢迎投稿优质内容
欢迎投稿分享人工智能领域相关的优秀研究成果,鼓励高校实验室、大企业研究团队、个人等,在wisemodel平台上分享各类优质内容,可以是AI领域最新论文解读、最新开源成果介绍,也可以是关于AI技术实践、应用和总结等。投稿可以发邮件到liudaoquan@wisemodel.cn,也可以扫码添加wisemodel微信。
4
关于wisemodel开源社区
始智AI wisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立,旨在打造和建设中立开放的AI开源创新社区,将打造成“HuggingFace”之外最活跃的AI开源社区,汇聚主要AI开源模型、数据集和代码等,欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者,以及政府部门、学会协会、联盟、基金会等,还有投资机构、科技媒体等,共同参与建设AI开源创新生态。
向上滑动查看
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.