机器学习周刊:关注Python、机器学习、深度学习、大模型等硬核技术,每周日or周一更新
欢迎收藏周刊网页版:https://weekly.zhanglearning.com/
1、如何学习深度学习?
最近X上有推友重提这篇文章,是网友看过 Jeremy 教授的 fast.ai 深度学习课程后,把每节课提到的学习建议和忠告都总结了下来:https://forums.fast.ai/t/things-jeremy-says-to-do/36682/1
我让ChatGPT、Claude、Gemini翻译并总结了这篇文章,Gemini完成的更加出色,抽取了20条关于学习方法和一些细节的建议(强烈建议,如果时间允许,可以看原文):
倾听:仔细注意老师在整堂课中的建议和提示。
不要被理论淹没:专注于运行代码并对其进行实验,而不是一开始就陷入理论细节中。
选择一个项目并把它做得精彩:选择一个你感兴趣的项目,并投入额外的精力,确保对其进行优化和改进。
探索不同的数据集:不要局限于课程中提供的数据集;自己寻找数据集并对其进行实验。
不要使你的代码过于复杂:保持你的代码简单和有条理,避免不必要的复杂性。
学习 Jupyter 快捷键:熟悉 Jupyter 快捷键以提高你的效率。
运行代码并对其进行实验:不要只阅读代码;运行它并尝试不同的输入和参数来观察会发生什么。
不要花几个小时试图立即理解所有理论:可以先不理解所有内容;专注于实践方面,并随着时间的推移逐渐加深你的理解。
阅读比赛获胜者的论文:通过阅读比赛获胜者的论文来学习他人的成功经验,注意他们的方法和见解。
使用你拥有的所有文本:在处理 NLP 时,确保使用所有可用的文本,包括未标记的验证集,以增强模型的性能。
学会发音希腊字母:熟悉深度学习论文中常用的希腊字母的发音。
非常习惯 PyTorch 张量:培养对 PyTorch 张量和运算的扎实理解。
应用广播规则:在处理更高秩张量时学习并应用广播规则。
不要假设库是正确的:对库持怀疑态度;验证其正确性并了解其工作原理。
不要担心你是否跟上了所有内容:感到不知所措是正常的;专注于你能理解的内容,并逐渐建立你的知识。
学会调试深度学习代码:调试 DL 代码具有挑战性;确保你的代码简单,并检查中间结果以尽量减少错误。
用玩具问题进行实验:创建并解决玩具问题以深入了解深度学习的概念和技术。
学习 Swift for TensorFlow:抓住机会学习 Swift for TensorFlow,它为 DL 开发提供了优势。
谨慎的数据增强: 在增强数据时,仔细考虑转换及其对数据完整性和标签准确性的影响。
尝试不同的架构:尝试不同的神经网络架构以深入了解它们的性能特征。
项目地址:https://github.com/krishnaik06/Roadmap-To-Learn-Generative-AI-In-2024
这个项目总结了生成式AI学习路线,从Python、机器学习、NLP、深度学习、GPT-4、Langchain、向量数据库、LLM项目部署,非常顺畅。
3、机器学习调查
地址:https://github.com/metrofun/machine-learning-surveys
有关主动学习、生物信息学、分类、度量学习、蒙特卡罗、多臂老虎机、多视图学习等方面的调查、教程和书籍的精选列表。
地址:https://github.com/eugeneyan/applied-ml
这个项目分享了各公司在生产中数据科学和机器学习方面的论文和技术博客,已经更新了3年。
主要内容包括:
如何构架问题 (例如,将个性化视为推荐系统 vs. 搜索 vs. 序列)
哪些机器学习技术有效 ✅(有时候,哪些不行 ❌)
为什么它有效,背后的科学原理包括研究、文献和引用
实现了什么现实世界的结果(可以更好地评估投资回报率 ⏰)
程序员Jiayuan (Forrest)在X上分享了开发者搜索工具 devv.ai 是如何构建RAG系统的过程,内容十分硬核。
这里是Treads汇总:https://typefully.com/Tisoga/PBB58Vu
6、MLC Chat
MLC Chat:在iPhone上离线运行7B最强LLM Mistral 中文不太行,速度很快,手机会发热
APP下载:https://apps.apple.com/gb/app/mlc-chat/id6448482937
Github:https://github.com/mlc-ai/mlc-llm
支持各种系统,能在各种设备上开发、优化和部署AI模型。包括iOS和安卓
7、Ollama
地址:https://ollama.ai/download
Ollama为那些在macOS、Linux(暂不支持Windows)上使用LLM的开发者提供了一种简便的解决方案,可以更轻松地将这些模型集成到自己的应用程序中。
Ollama目前支持了10余种大模型,安装后均可一个命令本地启动并运行
Model Parameters Size Download Neural Chat 7B 4.1GBollama run neural-chatStarling 7B 4.1GBollama run starling-lmMistral 7B 4.1GBollama run mistralLlama 2 7B 3.8GBollama run llama2Code Llama 7B 3.8GBollama run codellamaLlama 2 Uncensored 7B 3.8GBollama run llama2-uncensoredLlama 2 13B 13B 7.3GBollama run llama2:13bLlama 2 70B 70B 39GBollama run llama2:70bOrca Mini 3B 1.9GBollama run orca-miniVicuna 7B 3.8GBollama run vicunaLLaVA 7B 4.5GBollama run llava
8、DreaMoving
DreaMoving是一个基于扩散模型的人类舞蹈视频生成框架。能够根据指导序列和简单的内容描述(仅文本提示、仅图像提示或文本和图像提示)生成高质量、高保真度的视频。
体验:https://modelscope.cn/studios/vigen/video_generation/summary
9、苹果最新论文
论文:https://huggingface.co/papers/2312.11514
苹果发的这个论文《使用有限的内存实现更快的 LLM 推理》。通过将将模型参数保存在闪存里,根据需要移动到DRAM。使得能够运行的模型大小是可用DRAM的两倍,与传统的CPU和GPU加载方法相比,推理速度分别提高了4-5倍和20-25倍。
10、腾讯最新论文:《AppAgent: 多模态智能体,像真实用户一样操作手机》
首页:https://appagent-official.github.io
论文:https://arxiv.org/abs/2312.13771
地址:https://github.com/mnotgod96/AppAgent
论文通过引入一种基于大型语言模型(LLMs)的多模态智能代理(Agent)框架,赋予了智能体操作智能手机应用的能力。与传统的智能助手如 Siri 不同,AppAgent 不依赖于系统后端访问,而是通过模拟人类的点击和滑动等操作,直接与手机应用的图形用户界面(GUI)互动。这种独特的方法不仅提高了安全性和隐私性,还确保了智能体能够适应应用界面的变化和更新。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.