技能库 569 个
更多分类(146)
评估指标计算与自动化测试
实现BLEU/ROUGE等指标计算,并构建自动化测试流水线,确保大模型输出质量与一致性
Prompt工程与优化
设计并迭代prompt以提升模型输出质量与稳定性
奖励函数设计
根据强化学习任务目标,设计稀疏或稠密奖励函数以引导智能体高效学习
模型评估与错误分析
使用准确率、F1、混淆矩阵等指标评估模型,并进行错误模式分析以指导改进
冷启动策略开发
设计并实现基于内容、人口统计学或探索利用的冷启动推荐策略。
推理加速优化
应用vLLM、TensorRT等工具优化大模型推理速度与显存占用,提升服务吞吐与响应效率。
环境搭建与配置
使用Gymnasium等库创建和配置强化学习训练环境,支持自定义环境与标准接口集成。
GPU训练脚本编写与优化
编写PyTorch/TensorFlow分布式训练脚本,利用混合精度、梯度累积等技术优化训练效率
CUDA算子开发与优化
编写自定义CUDA kernel实现融合算子或专用操作,减少kernel launch次数,提升大模型推理效率
A/B实验配置与结果分析
设计并配置A/B实验,使用统计方法分析实验数据并产出结论。
安全与合规检查
实现内容过滤、脱敏、对抗攻击检测等安全机制,确保大模型应用符合安全与合规要求
说话人日志与分离
使用 pyannote.audio 等开源工具,对多人对话音频进行说话人聚类、语音活动检测(VAD)和语音分离,实现“谁在何时说话”的日志输出与分离音频生成
LoRA微调训练
基于LoRA方法对大模型进行参数高效微调,配置训练脚本并监控loss,适用于大模型训练工程师。
声学特征提取
使用librosa或torchaudio从语音信号中提取MFCC、Fbank、Mel频谱等特征,并完成标准化处理,为语音识别模型提供高质量输入。
离线评估指标计算
实现并计算AUC、NDCG、Recall等离线评估指标,分析模型效果。
数据预处理与特征工程
清洗、转换原始数据,设计并提取特征以提升模型性能
CTC解码与语言模型融合
实现CTC束搜索解码,并集成n-gram或神经网络语言模型优化识别结果。
语音活动检测(VAD)
实现WebRTC VAD或基于DNN的VAD模型,准确分割语音片段。
模型训练脚本编写
使用PyTorch或TensorFlow编写可复现的模型训练脚本,包括数据加载、损失函数、优化器配置和训练循环
模型量化与部署
使用GPTQ、AWQ等方法将大模型量化为4-bit或8-bit,并部署为可调用的API服务
模型可解释性分析
应用SHAP、LIME等方法解释模型预测,生成报告供业务方理解
TensorRT-LLM模型编译
使用TensorRT-LLM将大模型编译为优化引擎,应用量化、层融合等技巧以提升推理性能
模型部署与推理优化
使用ONNX、TensorRT等工具将训练好的NLP模型导出、优化推理性能,并部署至生产环境。
少样本学习方案设计
应用 Prompt Tuning、Adapter 或原型网络等方法解决标注数据不足问题的专业方案设计