云创大数据的实习岗位不仅针对在校的以及毕业的大学生,高中生也是可以的!
最近有两名学员顺利完成了云创大数据的实习课程,并各自写了一份实习报告心得,里面比较详实的记录了他们的学习内容以及切身感受,我们一起来看看吧~
— 实习报告全文 —
0 1
2025级应届录取生
浙江工业大学 软件工程专业
学生 / 卞炜正
一、引言
在信息技术飞速发展的今天,大数据与人工智能技术已成为推动各行业创新与发展的核心驱动力。我有幸获得了在云创大数据实习的机会,这是一家在大数据存储与智能处理领域极具影响力的企业,以数据和 AI 算法为引擎,驱动政府、教育、智能制造等领域的数字化、智能化转型升级。此次实习,为我打开了通往大数据与人工智能世界的实践之门。
二、岗位介绍
我在实习期间担任数字人项目开发实习生的组员身份,主要负责运用通义千问、Qwen 等大语言模型生成文案内容,通过文字转语音程序将文案转化为音频,利用 Heygem 数字人生成系统完成视频的制作,实现从文本到数字人视频的全流程创作。同时,深入学习数据库的使用,通过 Python 进行数据处理与分析的实战操作,运用 Python 爬虫技术获取相关数据,维护爬虫程序的稳定运行,调用 LLM 的 api ,实现模型与其他系统的交互,并对项目中的各个端口进行统筹规划,确保数据的流畅传输与系统的高效运行。
三、实习内容与成果 (一)融入数字人生成项目
数字人生成项目旨在利用先进的人工智能技术,打造高度逼真、个性化的数字人形象,应用于商业推广。在这个过程中,我逐渐熟悉了项目的整体架构和业务流程,明确了自己在项目中的职责,也感受到了团队成员之间紧密协作、积极进取的工作氛围,这使我迅速融入其中,为后续工作的开展奠定了良好基础。
(二)大模型与文案生成
Qwen 大模型在数字人生成项目中扮演着至关重要的角色,它们负责根据给定的主题和要求生成高质量的文案内容。在利用模型生成文案时,我遇到了一些挑战,如生成的文案有时会出现逻辑不连贯、内容空洞等问题。为了解决这些问题,我深入研究了模型的参数设置和提示工程技巧,通过调整提示词的结构、增加上下文信息、设置明确的指令等方式,引导模型生成更符合需求的文案。
(三)文字转语音与数字人视频生成
文字转语音程序和 Heygem 数字人生成系统是实现数字人从文本到视频转化的关键工具。在使用 Heygem 数字人生成系统生成视频时,也遇到了一些技术难题,如数字人的面部表情和肢体动作不够自然、视频合成过程中出现卡顿等。我通过深入学习 Heygem 的技术文档和操作指南,掌握了数字人模型的参数调整方法,对数字人的面部表情和肢体动作进行精细调整,使其更加符合文案的情感表达和语境。针对视频合成卡顿的问题,我检查了系统的硬件配置和软件设置,优化了视频渲染参数,采用了分批次渲染和多线程处理等技术,提高了视频合成的效率和稳定性。
(四)数据库、Python 与爬虫的学习运用
数据库在数字人生成项目中用于存储和管理大量的文本、音频、视频等数据,确保数据的安全、高效访问。我在实习期间学习了 MySQL 数据库的基本操作,包括数据库的创建、表的设计、数据的插入、查询、更新和删除等。通过实际项目中的应用,我深刻理解了数据库设计的重要性,学会了如何根据项目需求设计合理的数据库结构,优化数据库查询语句,提高数据的读写性能。
Python 作为一种广泛应用于数据处理和人工智能领域的编程语言,在项目中发挥着重要作用。我在实习前虽然对 Python 有一定的了解,但在实际项目中,面对复杂的业务逻辑和技术难题,我发现自己的知识储备还远远不够。于是,我利用业余时间系统学习了 Python 的高级特性,通过技术博客和开源项目等渠道,不断积累 Python 编程经验。在项目中,我运用 Python 进行数据处理和分析,编写脚本实现数据的自动化处理和任务调度,提高了工作效率。
爬虫技术则用于从互联网上获取与数字人相关的文本、图片和视频等数据,为数字人项目提供丰富的素材。我学习了 Python 爬虫的基本原理和常用框架,并结合实际项目需求,编写爬虫程序获取特定网站的数据。
四、实习收获与体会 (一)专业技能提升
在云创大数据实习的这段时间,我的专业技能得到了全方位的提升。在大语言模型的应用方面,我从最初的理论学习逐渐深入到实际操作,通过不断调整模型参数和优化提示词,能够更加熟练地运用Qwen 大模型生成高质量、符合业务需求的文案 。这不仅加深了我对大语言模型原理的理解,还让我掌握了如何根据不同的应用场景灵活运用模型的技巧,例如在为不同风格的数字人视频撰写文案时,能够精准地引导模型输出相应风格的内容。
数据库的学习与应用也让我对数据的存储和管理有了更深入的理解。通过学习 MySQL 数据库的操作,我能够根据项目需求设计合理的数据库表结构,编写高效的 SQL 查询语句,实现数据的快速存储、查询和更新。在数字人项目中,数据库用于存储大量的文本、音频和视频数据,我通过优化数据库查询语句和索引设计,确保了数字人系统的稳定运行。
(二)团队协作感悟
团队协作是我在实习期间的另一大重要收获。在数字人生成项目中,团队成员来自不同的专业领域,包括算法、开发、设计等,每个人都在项目中扮演着不可或缺的角色。通过与他们的紧密合作,我深刻体会到了团队协作的力量。经过大家的共同讨论和协作,最终找到了解决问题的最佳途径 ,提高了数字人视频的质量和用户体验。
团队合作精神的培养也是一个重要的方面。在项目遇到困难时,团队成员之间相互支持、相互鼓励,共同寻找解决问题的方法。在项目的攻坚阶段,由于时间紧迫,任务繁重,大家都面临着巨大的压力。但是,团队成员没有退缩,而是相互协作,共同攻克了一个又一个技术难题,确保了项目的按时完成。这种团队合作精神不仅让我在工作中感受到了温暖和力量,也让我明白了在一个团队中,只有大家心往一处想,劲往一处使,才能实现共同的目标。
五、总结与展望
回顾实习经历,我深感充实满足。在实践中深化了对专业知识的理解,掌握了许多实用的技术和方法,实现了从理论到实践的跨越。
实习过程中必不可少的是正式员工们悉心的指导和帮助。是你们的耐心教导和无私分享,让我能够迅速融入团队,顺利完成各项工作任务。
展望未来,大数据和人工智能领域将迎来更加广阔的发展空间,我希望能够继续在这个充满挑战和机遇的领域深入学习和探索,不断提升自己的专业素养和综合能力。未来,我计划进一步深入学习大语言模型的原理和应用,探索其在更多领域的创新应用;加强对人工智能算法和机器学习技术的研究,提升自己在模型训练和优化方面的能力;同时,关注行业的最新动态和发展趋势,不断拓宽自己的技术视野,为推动技术的发展贡献自己的一份力量。
0 2
南京理工大学紫金学院
软件工程专业(专业排名前十)
大三学生 / 李鑫
一、实习岗位介绍
我深知实习对职业发展的重要性,有幸于2025年4月7日至8月14日在南京云创大数据科技股份有限公司进行了为期超四个月的Java后端开发实习。作为后端 Java 开发岗实习生,主要负责协助团队进行后端服务的开发与维护。
具体工作包括:参与需求分析与技术方案设计,基于Spring Boot/Cloud框架开发RESTful接口;设计与优化数据库表结构,编写高效 SQL 语句;进行接口单元测试与集成测试;协助解决线上服务出现的技术问题;参与技术文档编写等。该岗位要求扎实的 Java 基础,熟悉常用开发框架及数据库技术,注重逻辑思维与问题解决能力。
二、实习内容及过程
实习初期,我在前辈指导下系统学习公司技术栈,包括 Spring Boot 框架核心原理、MyBatis 持久层框架应用、MySQL 数据库优化技巧等,熟悉自研大数据平台架构,掌握Git版本控制及代码规范;通过参与代码评审和文档学习,快速掌握了公司编码规范与开发流程,RESTFul风格开发。
中期参与公司重点项目 “智能知识图谱” 的后端开发,负责数据集管理模块。运用 Spring Cloud 微服务架构,设计并实现了资源查询、上传、统计等 多个核心接口,运用线程池加分布式锁解决了多文件同时调用算法并把结果快速反应给前端的并发控制问题。
三、实习总结与体会
(一)实习收获
1. 专业技能:熟练运用 Spring Boot、Spring Cloud 等框架进行微服务开发,掌握分布式事务处理、服务熔断降级等核心技术;精通 MySQL 索引优化、SQL 调优;具备独立进行后端接口开发、测试及问题排查的能力,技术水平达到初级开发工程师标准。
2. 工程实践:深刻理解软件工程中迭代开发、测试驱动等理念,参与完整的项目生命周期,掌握从需求分析到上线运维的全流程实践经验;熟悉自研大数据平台架构,掌握Git版本控制及代码规范。
3. 综合能力:提升了跨团队沟通协作能力,通过与前端、数据团队的频繁对接,学会了用清晰的技术语言表达需求;培养了问题拆解能力,面对复杂业务场景能快速定位核心问题并制定解决方案。
4. 这段实习经历不仅丰富了我的专业知识,提高了实战能力,更让我在技术探索的道路上变得更加勇敢和坚定。我深知,未来的学习和工作中仍有无数未知等待我去探索和征服。我将继续保持谦虚和勤奋,不断学习和钻研,为自己的职业道路打下坚实的基础。
(二)遇到的问题及解决方法
问题 1:大文件上传超时
现象:5GB 以上文件上传时频繁触发网关超时。
解决:实现分片上传(每片 5MB)+ 断点续传,前端通过 WebSocket 实时反馈进度,后端使用 Redis 记录分片上传状态,最终支持 20GB 文件稳定上传。
问题 2:文件 IO 流关闭异常
现象:高并发下偶发文件句柄泄露,导致系统无法创建新文件。
解决:采用 try-with-resources 语法强制资源释放,结合定时任务扫描未关闭的流,通过 JVM 监控工具验证,使句柄泄露率降为 0。
问题 3:分布式锁失效
现象:极端情况下出现锁超时导致的重复处理解决:实现锁自动续期机制(watch dog),结合 ZooKeeper 实现分布式锁降级方案,确保临界区资源安全。
针对小文件碎片化问题,设计合并存储策略,将小于 1MB 的文件打包存储,减少元数据查询次数,通过 AOP 实现接口访问日志记录与异常统一处理,使问题排查效率提升 50%。
(三)感悟
理论学习与工程实践存在显著差异,课堂上掌握的 Java 语法和数据结构知识,需要在实际开发中结合业务场景灵活运用。大数据领域的技术迭代速度远超预期,必须保持持续学习的习惯才能跟上技术发展。团队协作中,代码的可读性和可维护性比单纯实现功能更重要,良好的编码规范是提升团队效率的基础。
四、总结与展望
(一)总结
五个月的实习让我从理论学习走向工程实践,在南京云创大数据的技术氛围中,不仅夯实了后端 Java 开发技能,更深入理解了大数据平台的架构设计与实现逻辑。通过参与真实项目开发,将软件工程专业所学的需求分析、系统设计、测试优化等知识转化为实际能力,完成了从学生到准工程师的角色转变。
(二)展望
未来将继续深耕 Java 后端开发领域,重点学习分布式系统设计与大数据处理技术,计划通过架构师认证提升技术深度。同时保持对行业动态的关注,将所学技术与实际业务场景结合,努力成长为兼具技术能力与业务思维的开发工程师。感谢南京云创大数据提供的实习平台,期待未来能在技术领域持续精进,为行业发展贡献力量。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.