大数据技术研训站

一、产品概述

大数据技术研训站是一款一体化硬件设备，以工业级多维感知机柜系统为核心载体，融合智能光效控制、环境全域感知与交互显示终端等硬件，构建起稳定可靠的物理运行基座。设备搭载高性能大数据处理硬件与训练单元，形成强劲运算中枢支撑复杂数据处理与模型训练需求。核心科研训练硬件整合算法开发、数据管理、模型训练等全流程功能，通过智能化资源调度与权限配置硬件，实现多场景实训与科研协同。配套全流程综合项目实训硬件体系，涵盖多元化场景案例，覆盖数据采集、分析到可视化的完整链路，为大数据领域科研与技能培育提供一体化智能硬件解决方案。

二、产品功能

1、多维感知机柜设备

(一)整体架构

采用工业级设计标准，整体外形尺寸为宽≥0.6米、高≥1.8米、深21.0米的黄金比例架构，通过精密空间规划实现设备集成效率最大化。机身采用高强度冷轧钢板复合工艺，经多道表面处理工序形成纳米级防腐涂层，具备IP54级防尘防水性能，可在-30°C至70°C的极端环境工况下稳定运行，为核心设备提供全天候物理安全防护。

(二)光效智能控制单元搭载LED装饰机柜灯控硬件，采用分布式光纤传导技术，支持动态色域调节。硬件内置场景模式算法，可根据环境光强自动实现色温补偿，并通过通信协议与设备运行状态联动。灯组模组采用军工级散热设计，使用寿命长达≥10万小时，光衰率低于5%,实现美学呈现与功能性的完美融合。

(三)环境智能管控硬件

1.温湿度感知单元:配备高精度温湿度采集器，温度测量准确度≤0.5°C,湿度测量准确度≤±3%RH,量程覆盖温度-10~60°C、湿度0~100%RH的全场景需求。

2.智能门禁管理模块:工业级门禁控制器，采用宽压设计支持DC7~30V自适应供电，触点容量达到10A/30VDC与10A/250VAC的双重标准，确保在高负载工况下稳定运行。设备通过10万次耐久性测试验证，支持RS485总线型拓扑结构，配备1路电源状态LED指示与4路输出工况LED指示，在-40°C~85°C的宽温环境中保持零故障运行，构建多层次物理安防体系。

3.消防安全监测单元:搭载智能烟雾采集器，供电电压支持DC7~24V宽幅输入，在0°C~50°C工作温度与0~95%RH工作湿度范围内保持稳定性能。设备具备0.2%F-S/°C的超低温度漂移特性，内置自适应滤波算法，可有效规避粉尘、水汽等干扰因素，实现火灾隐患的早期精准预警。

4.数据通信转换中枢:配置高性能串口服务器，提供不少于8个工业级RS-485接口，所有信号端口均通过15KVESD静电防护认证，具备浪涌、过压、过流三重保护机制。支持ICMP、IP、TCP、UDP等全协议栈，可通过Web浏览器、Telnet远程终端、Console控制台三种方式进行配置管理，采用12VDC稳定供电设计，为多设备协同提供高可靠数据传输链路。

(四)智能交互显示终端

1.触控显示硬件平台:机架式32寸液晶触摸一体机，物理分辨率不低于1920*1080,搭载十点电容式触摸屏。采用原装IPS广视角面板，16:9显示比例，1200:1的高对比度，亮度达到300cd/m2的行业标杆水平。接口配置全面支持HDMI、VGA、DVI、USB等多规格信号输入，满足多源数据的无缝切换需求。

2.动态环境展示硬件:内置动态环境展示相关硬件，采用B/S架构设计支持多终端协同管理。具备实时数据监控功能，通过可视化引擎将温湿度、设备状态等参数以数值、动态图表、实景模拟等多维度形式呈现。搭载AI自适应控制算法，可根据数据变化自动实现关联设备的智能启停。内置完善报警机制，当监测参数超出预设阈值或出现通讯异常时，可通过声光报警等多渠道即时提示，并自动生成带时间戳的事件日志。数据统计分析模块采用分布式数据库架构，支持自定义时间维度(时/日/月/年)的趋势分析，通过机器学习算法识别异常波动规律，为设备运维提供数据驱动的决策支持，实现全生命周期智能化管理。

2、大数据处理设备

处理器:2颗主频≥2.4GHz的16核处理器;

内存:>16个内存插槽，总容量≥512GB DDR4(单根32GB);

存储:≥4.8TBSAS3.5英寸硬盘;

RAID卡:12Gb/s独立2GRAID卡;

网络接口:集成≥2个GE电口;

电源:≥2*900W交流电源。

3、大数据训练设备

处理器:2颗主频≥2.3GHz的20核处理器;

内存:≥16个内存插槽，总容量≥512GB DDR4(单根32GB);

存储:≥960GSSD硬盘+≥4.8TB3.5英寸硬盘;

RAID卡:12Gb/s独立2GRAID卡;

网络接口:集成≥2个GE电口;

数据挖掘单元:不低于4张，单张显存不低于24GB;

电源:≥2*2000W交流电源;散热:满配冗余风扇，支持4个热拔插风扇模组，具备N+1冗余。4、大数据挖掘及科研功能模块

1.硬件整合算法、数据集、训练、评估、在线部署、在线量化等功能，为用户提供一站式硬件服务，聚焦于算法模型本身，由硬件提供资源分配，包括cpu、内存、vGPU的管理和分配。各硬件模块相辅相成，共用基础资源，包括数据集、镜像、持久卷、算法、模型等，提高资源利用率，满足科研与实训。

2.硬件通过共享功能将内置的实训课程提供给用户使用，同时用户也可以将自身的实训课分享至共享课，提供给其他用户使用。

3.支持自行创建实训课，配置实训课名称、专业、课程介绍、封面等，可添加实验，配置实验环境，编写实验内容，实验文档编辑支持两种模式:富文本模式、MarkDown模式，富文本模式支持插入MarkDown文件进行展示。

4.实验环境配置支持新建实验环境，选择实验镜像、资源规格(CPU、内存、GPU)、数据集、模型、算法、持久卷等资源，并且在实际的实验中，将数据集、模型、算法、持久卷自动挂载至每个学生的实验实例中。

5.实验环境配置可选择继承上一个实验的实验环境，可保证同一个实验课程下的实验的连续性。

6.在实验过程中支持一键重置实验环境，用户的持久卷中的文件不会消失，实例中的系统环境还原至初始状态。

7.支持用户选择班级和实训课程创建课堂，选择开始授课后，用户进入课堂即可开始实验，左边为实验文档，右边为实验环境。

8.校级管理员可设置该机构每个学生可使用的CPU、内存、GPU显存的最大值，当机构内的GPU使用量达到最高值后，默认开始排队模式。

9.支持通过命令上传镜像和文件上传两种方式，镜像可设置多个镜像服务端口，并且可指定其中一个服务端口为主服务端口。

10.镜像可根据用途分为训练镜像、实验镜像、notebook镜像等。

11.支持教师侧设置默认使用的Notebook镜像，在后续的算法编辑可直接进行使用。

12.算法代码库分为公有算法代码和私有算法代码，公有算法代码支持调拨配置和校内用户共享，可进行下载、复制等操作;私有算法代码可自行进行上传文件新建，也可从公有算法代码库复制得到，可进行共享、在线编辑、创建训练任务、下载、复制、删除等操作。

13.持久卷管理，每个任务实例进行创建时，都能选择选择新建持久卷进行挂载，也可选择已存在的持久卷挂载。持久卷可进行快照、共享、删除等操作，其中卷类型分为原始、快照、共享。

14.对于已存在的持久卷，可详细的展示该持久卷挂载的实例详细信息，及使用的用户。

15.数据集分为公有仓库和私有仓库，公有仓库可初始化配置或校内用户共享，可详细的展示数据集的名称、数据量来源、描述等信息，可在线进行查看具体的数据集内容;私有仓库可自行进行上传已标注好的数据集，也可手动创建数据集，进行在线标注。

16.标签组管理，设置用于标注的标签组，可自定义每个标签的名称及标注颜色。

17.Notebook实例管理，算法代码在线编辑的Notebook实例也可在此进行管理，创建Notebook实例时可以选择开发镜像及版本，CPU、内存、GPU等规格类型，同时可以选择挂载数据集、多个模型、多个算法、多个持久卷到实例的目录，便于在科研中直接使用。

18.Notebook实例可进行启动、停止、打开、删除等操作，在notebook中编辑算法代码可直接保存为算法，并且实例销毁后该算法代码永久保存。

19.在线训练模型，可创建训练任务，选择预训练模型、镜像、训练算法、训练数据集、验证数据集;进行训练参数设置，包括训练轮数、批次大小、学习率、参数映射、CPU、内存、GPU。

20.训练任务展示当前训练任务的状态:运行中、停止、运行错误、排队中，可查看当前任务的运行时长以及具体实例，点击实例可查看该实例的详细信息;可进行保存模型、启动、停止、取消排队、删除、查看日志等操作。

21.支持用户基于已训练模型为基础继续迭代训练，可在训练任务中选择已有模型;

22.模型管理，可直接上传模型文件，选择模型框架，支持pytorch、TensorFlow、Keras、Caffe等框架;也可通过训练任务直接保存训练完成的模型。

23.在线评估模型性能，可创建模型评估任务，选择评估的模型、任务运行的镜像、评估使用的数据集、资源规格大小(CPU、内存、GPU).

24.模型评估任务可展示当前的评估任务的状态、进度、配置等信息，并且对于评估完成的任务可在线查看该模型的性能，包括准确率、精准率、召回率、F1等;可对评估任务进行启动、停止、编辑、删除、查看日志等操作。

25.支持在模型训练完成之后可进行模型评估，针对不同的算法类型会展现不同的技术指标;

26.在线部署验证，可创建在线部署任务，选择服务类型(HTTP模式、GRPC模式)、部署模型、是否自定义推理脚本、部署镜像、资源规格(CPU、内存、GPU)。部署镜像、资源规格(CPU、内存、GPU)。

27.在线部署任务展示在线调用推理的接口信息，包括接口地址、参数配置等;同时也可直接在平台上进行在线预测，选择上传预测数据，点击预测后可在线预测该模型的效果;方便进行调试可在线查看该实例的运行日志

28.模型在线量化，可创建模型在线量化任务，选择需要量化的模型、运行的镜像、量化使用的数据集、资源规格(CPU内存、GPU).

29.模型量化后可展示量化前后的模型性能对比，包括准确率、精准率、模型大小。可对量化任务进行启动、停、删除等操作。

30.资源管理，用户可管理自己所有的科研任务，包括训练、在线部署、算法代码、模型等。

31.校内管理员可实时监控硬件服务器的资源使用情况，以便在资源紧缺时进行硬件升级或扩展。

32.可查看内部数据集、算法、模型、镜像等资源的数据统计，包括但不限于公共资源数、公共资源内文件总数、私有资源数、私有资源内文件数。

33.任务管理区可查看当前的排队数，内置任务管理中心，资源不足时，用户可按照小时申请资源的使用权限，任务

中心自动进行资源调配，任务结束后自动开启排队中的下一个任务。

34.管理员可对任务中心进行管理，包括正在进行中的任务，可进行查看该任务的创建人、资源规格、申请时间、实际开始时间等，并可手动提前停止该任务;排队中的任务，可查看该任务的创建人、资源规则、申请时间等，并且可以进行任务调序、手动取消该任务;历史任务，可查看所有已完成的任务，包括任务的开始时间、创建人、结束时间、结束原因等。

35.任务中心配置黑名单管理，可选择用户加入黑名单，则该用户无法创建任何科研任务，同时也可将黑名单中的用户移除黑名单。

5、大数据技术综合项目实训存储单元

内置至少含人脸预警等10门综合案例实训资源包实训单元，所有实训资源均须包含实验文档、实验工具、实验镜像。