一、建设背景
在当今时代,大数据、云计算等前沿技术持续突破,大模型技术已然崛起为人工智能领域的关键研究方向。自 2022 年 11 月 ChatGPT 面世,大模型便迅速成为焦点,科技巨头们竞相推出大模型实验室解决方案。大模型不仅在互联网场景大放异彩,更凭借其能力垂直化特性,深度融入具体业务需求,展现出广阔的应用前景。
基于学校现有实验室建设基础,携手行业标杆企业,大模型实验室应运而生。它紧扣行业大模型产业发展脉搏,打造产学研一体化合作教学平台,催生 “教学相长、理论实践融合、校企协同共进” 的创新教育模式。该实验室既能助力院校 “双师型” 师资队伍建设,又能培育大模型应用开发领域的复合型、创新型人才。
鉴于产教融合实训基地开放共享应用需求,以及校企合作项目化特征,建设集教学培训、项目实践、科研等功能于一身的 “大模型技术应用实训室” 迫在眉睫。这将满足教学、科研、培训、社会服务等多元需求,产出一批具影响力的社会服务成果,推动科技成果转化与产业化,持续提升学校服务地方经济社会发展的能力。
在信息化社会浪潮下,高职院校作为高技能人才培养重镇,肩负着培育具备创新能力、实践能力与跨界融合能力的高素质人才的使命。建设大模型技术应用实训室,为学生打造实践平台,对提升高职院校人才培养质量、促进产学研用深度融合意义非凡,有助于批量孵化具备大模型技术应用能力的高素质人才,契合社会经济发展需求。
二、建设目标
1、优化高校大模型技术应用课程体系
致力于构建一个全面且深入的大模型技术应用课程框架,不仅丰富现有的人工智能教学资源,还将最新大模型技术及其实际应用案例融入其中。增加实验和实训环节的比例,确保学生在掌握理论知识的同时,通过动手实践深化对大模型技术的理解和运用能力。此举旨在促进高校人才的全面发展和技术技能的提升。
2、创建顶尖的大模型技术应用实训室
在现有校内实验室的基础上,与行业领军企业合作,专注于大模型技术的发展趋势,遵循“产业导向、项目驱动、能力培养、全面发展”的教育理念。利用先进的人工智能教学科研平台及真实的工业案例,建立一种将教学与学习、理论与实践、学校与企业紧密结合的教育模式。通过这种深度整合的方式,共同培育具备高技术水平的专业人才,涵盖从专业技能培训到师资力量提升,再到教育资源开发、实习实践以及科学研究等多个方面。
3、塑造人工智能开发应用领域的复合型人才
实训室建设的核心目的是为了培育具有坚实基础的大模型开发和应用专家。通过完善实训设施及相关软件的支持,为涉及大模型技术应用的教学活动提供全面保障,从而有效地支撑大模型技术领域所需核心人才的培养和发展。
4、激发创新创业潜能
在实际操作案例中,推动人工智能与其他学科(如艺术、设计、传媒等)之间的深度融合,鼓励学生跨领域思考和创新。借助大模型工具激发学生的创造力,培养他们的跨学科创新能力和社会责任感,最终向社会输送一批既拥有创新精神又具备实战经验的高素质“智能化”人才。这样不仅可以满足社会对创新型人才的需求,同时也促进了多学科间的交流与发展。
三、唯众大模型技术应用实训室关键技术
(一)模型架构设计与优化
模型架构设计是大模型的核心基础,它直接决定了模型处理海量数据、提取有价值信息的能力。架构设计不仅需要考虑模型的深度和宽度,还要兼顾其灵活性和可扩展性,以适应不同任务需求。同时,模型优化是提升性能的关键环节,包括超参数调整、模型剪枝、量化等技术。通过这些技术,可以有效减少计算量、降低内存占用、提高推理速度,从而优化模型的整体性能。
(二)预训练与迁移学习
预训练技术是大模型的重要支撑,通过在海量无标注数据上进行学习,模型能够掌握通用的知识表示,形成强大的语义理解能力。迁移学习则进一步拓展了预训练模型的应用范围,允许将预训练好的模型迁移到新的任务上,并通过微调适应特定领域的需求。这种技术不仅减少了标注数据的需求,还极大地提高了模型在新任务上的性能,加速了模型的落地应用。
(三)分布式计算与并行处理
大模型的训练通常涉及海量数据和复杂计算,对计算资源提出了极高要求。分布式计算和并行处理技术成为解决这一问题的关键。通过将训练任务分解并分配到多个计算节点上,利用多核CPU、GPU等硬件资源进行并行处理,可以显著提高训练效率,缩短模型训练时间,从而加速模型的迭代和优化。
(四)数据处理与特征工程
高质量的数据是训练优秀模型的基石。数据处理包括数据清洗、标注、增强等操作,旨在去除噪声、补充缺失值、扩充数据量,从而提高数据的质量和可用性。特征工程则是从原始数据中提取有意义的特征,通过特征选择、特征转换等方法,将数据转化为模型能够有效学习的格式,提升模型的训练效果和泛化能力。
(五)自动化机器学习(AutoML)
随着模型规模和复杂度的不断增加,手动调整超参数和模型结构变得越来越困难且耗时。自动化机器学习(AutoML)技术应运而生,通过自动化的搜索算法,快速寻找最优的超参数组合和模型架构,大大降低了模型调优的难度,提高了模型性能和开发效率,使开发者能够更专注于模型的应用和优化。
(六)模型压缩与部署
大模型通常具有较高的计算复杂度和存储需求,这在实际应用中带来了诸多挑战。模型压缩技术,如剪枝、量化等,通过去除冗余信息、降低模型精度等方式,有效降低模型的复杂度和存储大小,使其能够适应资源有限的设备。同时,高效的模型部署技术也是确保模型在实际场景中高效运行的关键,包括优化推理引擎、适配不同硬件平台等,从而实现模型的快速响应和广泛应用。
实训室布局图
四、实训室建设内容
4.1 大模型技术应用教学平台
大模型技术应用教学平台是基于现代信息技术,包括计算机技术、多媒体技术和网络通信技术,针对职业教育的发展需求而设计的一种创新教学模式。该平台融合了现代教育理念、教学内容与信息技术,形成了一个多功能、开放式的教、学、训一体化交互平台。
1.架构与部署:平台采用B/S结构,利用Spring Cloud微服务技术,并通过Kubernetes进行部署,支持公有云、私有云及混合云的安装模式。它支持多数据源以确保技术一致性,保障服务的稳定性、可扩展性和弹性扩容能力。每个独立服务都支持分布式集群部署,可以无限横向扩展,提高系统处理能力和大规模并发教学场景的支持能力。
2.主要模块:
(1)通用课程模块:涵盖课程制作工具、作业、活动、云盘、共享课、我的课、云优选课、云视频库和3D模型库等功能。
- 课程制作工具:支持PDF、PPT、Word、Excel等多种格式文本、图片、音频、视频及超链接的混合编排,并自动生成动态课程目录。支持多种格式文件(如图片、视频、压缩文件等)同屏展示。
- 作业模块:支持单选题、多选题、判断题、主观题等多种题型,提供自定义出题和自动出题功能,具备作弊监控和客观题自动评分功能。
- 共享课与我的课:允许教师将自己创建或积累的课程归档为“我的课程”,并能将共享课程、云优选课、云视频库中的课程转化为个人课程,支持一键分享到公共资源池中。
- 课堂活动:包含签到、主题讨论、提问、分组任务、投票、问卷、计时器等多种互动形式,增强课堂趣味性和参与度。
- 云优选课:整合了多门课程的教学材料,如教材、教案、课件等,内置至少100个不少于20分钟的在线课程视频,支持智能备课和一键上课。
- 云视频库:提供数字化教学内容,支持课堂教学、远程教学和课外学习,充实校内图书馆数字资源,助力示范性职业院校建设和精品课程开发。
- 个人云盘:提供分类管理的云存储服务,支持按类型分类(如视频、音频、图片、文档等),实现一键上传、删除、新建、重命名和移动等功能。
- 3D模型库:至少包含50个3D模型,配备虚拟仿真教学工具,支持3D模型播放和交互操作。
(2)考试模块:支持试卷导入、手动创建、题库选题三种方式构建考试,同时提供自动组卷和判分功能。
此外,平台内置丰富的大模型技术基础课程资源,如大模型简介、Python与大模型、LLM大模型API、C++与大模型、CUDA基础、LangChain基础、向量数据库、Prompt工程、大模型应用开发等,旨在全面覆盖并深入讲解大模型技术的相关知识。
4.2 大模型项目实训管理平台
大模型项目实训管理平台旨在覆盖实训项目的整个生命周期,从项目的创建、任务分配、文档管理、代码开发与测试,到实验环境配置和成果提交与评估等各个环节,提供全面支持。
1.项目全生命周期管理:
用户可以轻松创建新的实训项目,设定项目基本信息、目标及团队成员,并为每个成员分配具体任务。通过实时跟踪任务完成情况,确保项目按计划推进。
平台提供了项目成果展示区,方便团队成员分享经验和技术文档,促进知识交流和团队协作。
2.文档管理系统:
支持上传、编辑和保存各类实训文档(如需求文档、设计文档、测试报告),并提供分类功能,使用户能够根据项目或类型快速检索所需文档。
文档版本控制保证了内容的准确性和一致性,同时支持多人协同编辑,提高工作效率。
3.集成开发工具:
集成了大模型开发所需的各种工具,包括模型训练框架、数据预处理工具、性能分析工具等,实现了从代码开发到测试的一站式服务。
平台允许自定义调用CPU和内存资源,并可自由配置硬件加速器(如GPU或XPU),以适应大模型和深度学习任务的需求。特别地,它支持主流的大模型基座私有化部署,例如智谱的ChatGLM、百川的Baichuan、阿里的Qwen等,助力用户高效进行大模型开发和微调。
4.实验环境管理:
实现实验机运行状态的实时监控,涵盖CPU、内存、磁盘使用情况,并提供远程管理功能,便于故障排除和日常维护。
通过收集和展示项目进度、任务完成情况、代码提交量等统计数据,帮助用户全面了解项目状况。
5.权限管理与资源分配:
设置不同的用户角色和权限,确保信息的安全性和隐私性,仅限于授权用户访问相应内容。
灵活的资源分配机制让用户能够便捷地使用、开发和管理大模型应用,同时提供整套开发环境和资源监控功能,简化了操作流程。
该平台不仅提高了大模型项目实训的效率和质量,还促进了跨学科的合作与创新,为培养具有实战能力的人工智能专业人才提供了坚实的基础。
4.3 大模型项目资源包
1.基于LLM的智能知识库问答系统: 这个系统基于大型语言模型(LLM),提供了一整套即时可用的功能,包括数据处理、模型调用等,并通过直观的Flow工作流编排工具实现复杂问答场景的设计与执行。它旨在简化创建和管理复杂的对话式AI应用过程。
2.智能证件照制作算法: 采用OpenCV模型并通过Python语言实现,集成了智能抠图、人脸检测及尺寸裁剪等功能,形成一个完整的机器学习解决方案。该算法能够识别多种拍照环境,进行精准抠图并生成符合不同规格要求的标准证件照,同时支持智能更换正装背景等功能,如轻量级抠图、根据特定尺寸调整证件照片大小等。
3.计算机视觉应用:手写数字识别: 利用深度学习技术构建的手写数字识别模型,基于著名的MNIST数据库,使用流行的TensorFlow和Keras框架开发。这个示例项目展示了如何从头开始构建一个高效的手写数字识别系统,是学习计算机视觉和深度学习基础知识的理想选择。
4.4 大模型技术应用平台
大模型技术应用平台专为高校的大模型应用场景设计,既适用于教学也服务于科研。该平台具备以下特点:
- 用户友好的操作界面:支持txt、doc、pdf、md等多种格式的数据文件上传,提供了一个简洁易懂的操作配置界面,使得用户可以轻松搭建和训练AI应用,并迅速投入使用。
- 强大的适应性:能够满足不同领域的交互式对话场景需求,无论是教育、研究还是实际应用,都能找到合适的解决方案。
- 可视化的工作流编排:允许用户通过拖拽组件的方式构建复杂问答场景,无需编写代码即可完成高级功能设置,极大地降低了技术门槛。
- 提升教学与科研质量:借助此平台,用户可以更有效地利用大模型技术,促进创新思维和技术能力的发展,从而提高整体的教学质量和科研水平。
4.5 大模型技术应用教学平台
CPU:采用多核心处理器,例如Intel志强系列,核心数不少于24,确保能够并发处理多个微服务实例。
RAM:至少配备64 GB DDR4 RAM,保障同时运行多个微服务实例及相关应用程序的流畅性。
存储:选用SATA SSD或HDD,容量至少4 TB,用于数据存储和备份,可根据实际需求扩展容量。
网络:至少配置10 GbE网络接口,实现高速内部网络通信和负载均衡。
主板:支持硬件虚拟化技术(如Intel VT-x或AMD-V),兼容多核心CPU和大量RAM。提供足够的PCIe插槽,便于扩展网络适配器和存储设备。
电源供应:选用至少750W、具备金牌或白金效率认证的电源,确保供电稳定。
散热系统:采用高性能CPU散热器,如空气散热器或液冷系统,确保设备稳定运行。
数据传输与连接:提供USB 3.0或更高版本端口,便于连接外部存储和其他设备;同时配备HDMI端口,用于连接显示器。
4.6 大模型项目实训平台
CPU:选用Intel Xeon Gold 6230或AMD EPYC 7742等高性能处理器,具备多个核心(至少24核)和高速缓存,支持并行处理和高效数据预处理。
GPU:配备NVIDIA GeForce RTX 4090显卡,拥有大量CUDA核心和高速内存,适合深度学习模型的训练。
RAM:至少256 GB DDR4 ECC内存,满足大型模型训练和数据处理的需求。
存储:选用HDD或SSD,容量至少8 TB,用于数据存储和备份。
主板:支持dual-width GPU插槽,确保显卡正确安装和散热;同时提供足够的PCIe插槽,便于扩展其他高速设备。
电源供应:选用至少1200W、具备金牌或白金效率认证的电源,保障供电稳定。
散热系统:采用强劲的CPU散热器(如液冷或大型空气散热器)和显卡专用散热系统(如水冷或高性能风扇),确保设备高效运行。
机箱:选用大型机箱,具备良好的散热和扩展空间,便于安装多个GPU和散热设备。
网络:至少配置10 GbE网络接口,实现快速数据传输和模型同步。
数据传输与连接:提供USB 3.0或更高版本端口,便于连接外部存储和其他设备;同时配备HDMI端口,用于连接显示器。
