发布日期 :2025-02-21 20:35:11 来源 :本站 浏览量:8
2月21日,空港数字城市在郑州航空港区管委会成功举办以“解码DeepSeek:大模型技术前沿与应用”为主题的技术培训活动。
此次培训特别邀请了郑州大学计算机与人工智能学院智能集群系统教育部工程研究中心的刘起东教授作为主讲嘉宾,区党政办、组织人事部、科工局、城运中心等200余人参与此次培训,共同探索大模型技术赋能城市高质量发展的新路径。
培训伊始,空港数字城市副总经理魏文普对各位参训人员的到来表示了热烈的欢迎和衷心的感谢。他强调了在当前数字化转型的大背景下,掌握和应用大模型技术对于提升港区建设水平的重要性,并期待通过刘教授的分享,能够为大家带来新的启发和思考。
追溯AI发展脉络,洞察大模型崛起之路
培训中,刘起东教授先回顾了人工智能发展历程,从 1956 年美国达特茅斯会议 “人工智能” 概念诞生,到 ChatGPT 掀起热潮,展现了人工智能从理论探索到实际应用的巨大跨越。刘教授特别指出大模型作为人工智能发展的关键阶段,具有参数数量庞大、训练数据量大、计算资源需求高的特点,在自然语言处理、图像识别等领域取得显著成果,已成为推动各行业变革的重要力量。
剖析DeepSeek优势,解锁前沿技术密码
在介绍 DeepSeek 时,刘教授详细阐述了其独特优势。DeepSeek 推出的基础模型(V3)、深度思考(R1)、联网搜索三种模式,分别适用于不同场景。V3 模型高效便捷,适用于日常任务;R1 模型专注复杂推理和深度分析;联网搜索模式则能实时获取最新资讯。同时,DeepSeek 在技术上不断创新,如 V2 版本的 DeepSeekMoE 和 MLA 技术,实现稀疏激活、降低计算成本和存储开销;V3 版本通过基础设施优化和 Multi - Token Prediction(MTP)技术,提升生成速度和性能。R1 模型更是独立探索出基于大规模强化学习的大语言模型推理技术路线,打破技术壁垒,且模型开源,为行业发展提供了有力支持。
实操技术应用,领略大模型实用魅力
此外,刘教授还介绍了大模型的本地部署与 API 调用方法,以 Ollama 和 ChatBox 等工具为例,演示了如何便捷地在本地部署 DeepSeek 模型,实现离线高效使用、保障数据隐私安全,同时展示了 ChatBox 等软件与 DeepSeek 模型结合的应用场景,如智能问答、文档处理等,让参会人员直观感受到大模型技术的实用性。
此次培训活动得到了参会人员的一致好评。大家纷纷表示,通过刘教授的分享,不仅拓宽了视野、增长了知识,也更加清晰地认识到了大模型技术在推动港区建设中的重要作用。他们期待能够在未来的工作中积极探索和实践这些前沿技术,为港区的数字化转型和高质量发展贡献自己的力量。
空港数字城市副总经理魏文普表示,本次培训不仅是一次技术科普,更是推动人工智能与港区实际业务深度融合的起点。未来,公司将联合高校与科研机构,加快构建本地化大模型应用生态,助力航空港打造人工智能之城。