8月12日,360智脑团队宣布提出新的Light‑IF框架,以预览‑自检式推理和信息熵控制为核心,提升模型在复杂指令上的遵循度。Light‑IF框架包括五个关键环节:难度感知指令生成、Zero-RL强化学习、推理模式提取与过滤、熵保持监督冷启动、熵自适应正则强化学习。Light-IF-32B/14B/8B/4B/1.7B全系模型将陆续在Hugging Face开放。
本文源自:金融界AI电报
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.