# DataTunerX ![DTX Logo](https://raw.githubusercontent.com/DataTunerX/datatunerx-controller/main/assets/logo/Logo_DataTunerX%20-%20Horizontal%20-%20Color%20Light.png#gh-dark-mode-only) ![DTX Logo](https://raw.githubusercontent.com/DataTunerX/datatunerx-controller/main/assets/logo/Logo_DataTunerX%20-%20Horizontal%20-%20Color%20Dark.png#gh-light-mode-only) ![Kubernetes](https://img.shields.io/badge/kubernetes-%23326ce5.svg?style=flat&logo=kubernetes&logoColor=white) ![release](https://img.shields.io/badge/version-0.1.0-blue) ![fine-tuning](https://img.shields.io/badge/fine--tuning-8B3E3) **DataTunerX(DTX)** 设计为与分布式计算框架集成的云原生解决方案。利用可扩展的 **GPU** 资源,它是一个专为高效微调 **LLMs** 而构建的平台,重点放在实用性上。其核心优势在于促进批量微调任务,使用户能够在单个 **实验** 中同时进行多个任务。 **DTX** 包含了数据集管理、超参数控制、微调工作流、模型管理、模型评估、模型比较推断和模块化插件系统等基本功能。 **技术栈** : **DTX** 基于云原生原则构建,采用包含不同 **自定义资源定义(CRDs)** 和 **控制器** 逻辑的各种[运算符](https://www.redhat.com/en/topics/containers/what-is-a-kubernetes-operator)。主要使用 **Go** 进行开发,实现利用[operator-sdk](https://github.com/operator-framework/operator-sdk)工具包。在[Kubernetes(K8s)](https://github.com/kubernetes/kubernetes)环境中运行, **DTX** 依赖于 **CRD** 开发和管理的运算符模式。此外, **DTX** 与[kuberay](https://github.com/ray-project/kuberay)集成,以利用分布式执行和推断能力。 **状态** : **v0.1.0** - 早期开发阶段。有关最近更新的详细信息,请参阅[CHANGELOG](https://github.com/DataTunerX/datatunerx/blob/main/CHANGELOG.md)。 **快速演示和更多文档** : - 演示
- [文档](https://github.com/DataTunerX/datatunerx-controller)(即将推出) **屏幕截图** : ![DTX屏幕截图](https://raw.githubusercontent.com/DataTunerX/datatunerx-controller/main/assets/screenshot/Job_Details.png) ## DTX 能做什么? 💪 **DTX** 为用户提供了一套功能强大的功能,旨在高效微调大型语言模型。了解使 **DTX** 成为一个多功能平台的功能: ### 数据集管理 🗄️ 通过支持 **S3** 协议( **http** 即将推出)和本地数据集上传,轻松管理数据集。数据集以测试、验证和训练等拆分方式组织。此外,特征映射增强了微调作业的灵活性。