一、产品概述
大数据技术研训站是一款一体化硬件设备,以工业级多维感知机柜系统为核心载体,融合智能光效控制、环境全域感知与交互显示终端等硬件,构建起稳定可靠的物理运行基座。设备搭载高性能大数据处理硬件与训练单元,形成强劲运算中枢支撑复杂数据处理与模型训练需求。核心科研训练硬件整合算法开发、数据管理、模型训练等全流程功能,通过智能化资源调度与权限配置硬件,实现多场景实训与科研协同。配套全流程综合项目实训硬件体系,涵盖多元化场景案例,覆盖数据采集、分析到可视化的完整链路,为大数据领域科研与技能培育提供一体化智能硬件解决方案。
二、产品功能
1、多维感知机柜设备
(一)整体架构
采用工业级设计标准,整体外形尺寸为宽≥0.6米、高≥1.8米、深21.0米的黄金比例架构,通过精密空间规划实现设备集成效率最大化。机身采用高强度冷轧钢板复合工艺,经多道表面处理工序形成纳米级防腐涂层,具备IP54级防尘防水性能,可在-30°C至70°C的极端环境工况下稳定运行,为核心设备提供全天候物理安全防护。
(二)光效智能控制单元搭载LED装饰机柜灯控硬件,采用分布式光纤 传导技术,支持动态色域调节。硬件内置场景模式算法,可根据环境光强自动实现色温补偿,并通过通信协议与设备运行状态联动。灯组模组采用军工级散热设计,使用寿命长达≥10万小时,光衰率低于5%,实现美学呈现与功能性的完美融合。
(三)环境智能管控硬件
1.温湿度感知单元:配备高精度温湿度采集器,温度测量准确度≤0.5°C,湿度测量准确度≤±3%RH,量程覆盖温度-10~60°C、湿度0~100%RH的全场景需求。
2.智能门禁管理模块:工业级门禁控制器,采用宽压设计支持DC7~30V自适应供电,触点容量达到10A/30VDC与10A/250VAC的双重标准,确保在高负载工况下稳定运行。设备通过10万次耐久性测试验证,支持RS485总线型拓扑结构,配备1路电源状态LED指示与4路输出工况LED指示,在-40°C~85°C的宽温环境中保持零故障运行,构建多层次物理 安防体系。
3.消防安全监测单元:搭载智能烟雾采集器,供电电压支持DC7~24V宽幅输入,在0°C~50°C工作温度与0~95%RH工作湿度范围内保持稳定性能。设备具备0.2%F-S/°C的超低温度漂移特性,内置自适应滤波算法,可有效规避粉尘、水汽等干扰因素,实现火灾隐患的早期精准预警。
4.数据通信转换中枢:配置高性能串口服务器,提供不少于8个工业级RS-485接口,所有信号端口均通过15KVESD静电防护认证,具备浪 涌、过压、过流三重保护机制。支持ICMP、IP、TCP、UDP等全协议栈,可通过Web浏览器、Telnet远程终端、Console控制台三种方式进行配置管理,采用12VDC稳定供电设计,为多设备协同提供高可靠数据传输链路。
(四)智能交互显示终端
1.触控显示硬件平台:机架式32寸液晶触摸一体机,物理分辨率不低于1920*1080,搭载十点电容式触摸屏。采用原装IPS广视角面板,16:9显示比例,1200:1的高对比度,亮度达到300cd/m2的行业标杆水平。接口配置全面支持HDMI、VGA、DVI、USB等多规格信号输入,满足多源数据的无缝切换需求。
2.动态环境展示硬件:内置动态环境展示相关硬件,采用B/S架构设计支持多终端协同管理。具备实时数据监控功能,通过可视化引擎将温湿度、设备状态等参数以数值、动态图表、实景模拟等多维度形式呈现。搭载AI自适应 控制算法,可根据数据变化自动实现关联设备的智能启停。内置完善报警机制,当监测参数超出预设阈值或出现通讯异常时,可通过声光报警等多渠道即时提示,并自动生成带时间戳的事件日志。数据统计分析模块采用分布式数据库架构,支持自定义时间维度(时/日/月/年)的趋势分析,通过机器学习算法识别异 常波动规律,为设备运维提供数据驱动的决策支持,实现全生命周期智能化管理。
2、大数据处理设备
处理器:2颗主频≥2.4GHz的16核处理器;
内存:>16个内存插槽,总容量≥512GB DDR4(单根32GB);
存储:≥4.8TBSAS3.5英寸硬盘;
RAID卡:12Gb/s独立2GRAID卡;
网络接口:集成≥2个GE电口;
电源:≥2*900W交流电源。
3、大数据训练设备
处理器:2颗主频≥2.3GHz的20核处理器;
内存:≥16个内存插槽,总容量≥512GB DDR4(单根32GB);
存储:≥960GSSD硬盘+≥4.8TB3.5英寸硬盘;
RAID卡:12Gb/s独立2GRAID卡;
网络接口:集成≥2个GE电口;
数据挖掘单元:不低于4张,单张显存不低于24GB;
电源:≥2*2000W交流电源;散热:满配冗余风扇,支持4个热拔插风扇模组,具备N+1冗余。4、大数据挖掘及科研功能模块
1.硬件整合算法、数据集、训练、评估、在线部署、在线量化等功能,为用户提供一站式硬件服务,聚焦于算法模型本身,由硬件提供资源分配,包括cpu、内存、vGPU的管理和分配。各硬件模块相辅相成,共用基础资源,包括数据集、镜像、持久卷、算法、模型等,提高资源利用率,满足科研与实训。
2.硬件通过共享功能将内置的实训课程提供给用户使用,同时用户也可以将自身的实训课分享至共享课,提供给其他用户使用。
3.支持自行创建实训课,配置实训课名称、专业、课程介绍、封面等,可添加实验,配置实验环境,编写实验内容,实验文档编辑支持两种模式:富文本模式、MarkDown模式,富文本模式支持插入MarkDown文件进行展示。
4.实验环境配置支持新建实验环境,选择实验镜像、资源规格(CPU、内存、GPU)、数据集、模型、算法、持久卷等资源,并且在实际的实验中,将数据集、模型、算法、持久卷自动挂载至每个学生的实验实例中。
5.实验环境配置可选择继承上一个实验的实验环境,可保证同一个实验课程下的实验的连续性。
6.在实验过程中支持一键重置实验环境,用户的持久卷中的文件不会消失,实例中的系统环境还原至初始状态。
7.支持用户选择班级和实训课程创建课堂,选择开始授课后,用户进入课堂即可开始实验,左边为实验文档,右边为实验环境。
8.校级管理员可设置该机构每个学生可使用的CPU、内存、GPU显存的最大值,当机构内的GPU使用量达到最高值后,默认开始排队模式。
9.支持通过命令上传镜像和文件上传两种方式,镜像可设置多个镜像服务端口,并且可指定其中一个服务端口为主服务端口。
10.镜像可根据用途分为训练镜像、实验镜像、notebook镜像等。
11.支持教师侧设置默认使用的Notebook镜像,在后续的算法编辑可直接进行使用。
12.算法代码库分为公有算法代码和私有算法代码,公有算法代码支持调拨配置和校内用户共享,可进行下载、复制等操作;私有算法代码可自行进行上传文件新建,也可从公有算法代码库复制得到,可进行共享、在线编辑、创建训练任务、下载、复制、删除等操作。
13.持久卷管理,每个任务实例进行创建时,都能选择选择新建持久卷进行挂载,也可选择已存在的持久卷挂载。持久卷可进行快照、共享、删除等操作,其中卷类型分为原始、快照、共享。
14.对于已存在的持久卷,可详细的展示该持久卷挂载的实例详细信息,及使用的用户。
15.数据集分为公有仓库和私有仓库,公有仓库可初始化配置或校内用户共享,可详细的展 示数据集的名称、数据量来源、描述等信息,可在线进行查看具体的数据集内容;私有仓库可自行进行上传已标注好的数据集,也可手动创建数据集,进行在线标注。
16.标签组管理,设置用于标注的标签组,可自定义每个标签的名称及标注颜色。
17.Notebook实例管理,算法代码在线编辑的Notebook实例也可在此进行管理,创建Notebook实例时可以选择开发镜像及版本,CPU、内存、GPU等规格类型,同时可以选择挂载数据集、多个模型、多个算法、多个持久卷到实例的目录,便于在科研中直接使用。
18.Notebook实例可进行启动、停止、打开、删除等操作,在notebook中编辑算法代码可直接保存为算法,并且实例销毁后该算法代码永久保存。
19.在线训练模型,可创建训练任务,选择预训练模型、镜像、训练算法、训练数据集、验 证数据集;进行训练参数设置,包括训练轮数、批次大小、学习率、参数映射、CPU、内存、GPU。
20.训练任务展示当前训练任务的状态:运行中、停止、运行错误、排队中,可查看当前任务的运行时长以及具体实例,点击实例可查看该实例的详细信息;可进行保存模型、启动、停止、取消排队、删除、查看日志等操作。
21.支持用户基于已训练模型为基础继续迭代训练,可在训练任务中选择已有模型;
22.模型管理,可直接上传模型文件,选择模型框架,支持pytorch、TensorFlow、Keras、Caffe等框架;也可通过训练任务直接保存训练完成的模型。
23.在线评估模型性能,可创建模型评估任务,选择评估的模型、任务运行的镜像、评估使用的数据集、资源规格大小(CPU、内存、GPU).
24.模型评估任务可展示当前的评估任务的状态、进度、配置等信息,并且对于评估完成的任务可在线查看该模型的性能,包括准确率、精准率、召回率、F1等;可对评估任务进行启动、停止、编辑、删除、查看日志等操作。
25.支持在模型训练完成之后可进行模型评估,针对不同的算法类型会展现不同的技术指标;
26.在线部署验证,可创建在线部署任务,选择服务类型(HTTP模式、GRPC模式)、部署模型、是否自定义推理脚本、部署镜像、资源规格(CPU、内存、GPU)。部署镜像、资源规格(CPU、内存、GPU)。
27.在线部署任务展示在线调用推理的接口信息,包括接口地址、参数配置等;同时也可直接在平台上进行在线预测,选择上传预测数据,点击预测后可在线预测该模型的效果;方便进行调试可在线查看该实例的运行日志
28.模型在线量化,可创建模型在线量化任务,选择需要量化的模型、运行的镜像、量化使用的数据集、资源规格(CPU内存、GPU).
29.模型量化后可展示量化前后的模型性能对比,包括准确率、精准率、模型大小。可对量化任务进行启动、停、删除等操作。
30.资源管理,用户可管理自己所有的科研任务,包括训练、在线部署、算法代码、模型等。
31.校内管理员可实时监控硬件服务器的资源使用情况,以便在资源紧缺时进行硬件升级或扩展。
32.可查看内部数据集、算法、模型、镜像等资源的数据统计,包括但不限于公共资源数、公共资源内文件总数、私有资源数、私有资源内文件数。
33.任务管理区可查看当前的排队数,内置任务管理中心,资源不足时,用户可按照小时申请资源的使用权限,任务
中心自动进行资源调配,任务结束后自动开启排队中的下一个任务。
34.管理员可对任务中心进行管理,包括正在进行中的任务,可进行查看该任务的创建人、资源规格、申请时间、实际开始时间等,并可 手动提前停止该任务;排队中的任务,可查看 该任务的创建人、资源规则、申请时间等,并且可以进行任务调序、手动取消该任务;历史任务,可查看所有已完成的任务,包括任务的开始时间、创建人、结束时间、结束原因等。
35.任务中心配置黑名单管理,可选择用户加入黑名单,则该用户无法创建任何科研任务,同时也可将黑名单中的用户移除黑名单。
5、大数据技术综合项目实训存储单元
内置至少含人脸预警等10门综合案例实训资源包实训单元,所有实训资源均须包含实验文档、实验工具、实验镜像。
