Skip to content

Latest commit

 

History

History
101 lines (77 loc) · 4.84 KB

README-zh-CN.md

File metadata and controls

101 lines (77 loc) · 4.84 KB

NTCore:自主多云的AI/ML模型部署与监控平台

workflows-intro

Docker Image Version (latest by date) Docker Pulls License PyPI GitHub last commit

English | 简体中文


概述

NTCore可帮助数据科学家和机器学习工程师轻松地对AI/ML模型进行版本控制、部署和监控。

  • 自动记录各种机器学习框架的模型实验元数据,例如 sklearn、tensorflow 和 keras 等。
  • 支持Docker、Kubernetes并一键部署到公有云(例如 AWS、Azure、Alicloud 等)或私有云(On-premises)。
  • 实时仪表盘,监控和报告模型各项参数与运行情况。

特征

  • 自动对主流AI/ML模型框架(包括 sklearn、tensorflow 和 keras 等)进行版本控制。
  • 记录模型训练元数据(例如召回率和精确度),易于模型审计与重复利用。
  • 提供通过 curl、Postman 和 HTTP 客户端调用的 RESTful 端点。
  • 支持 Docker、Kubernetes ,一键部署到各大云提供商(例如 Amazon EKS、Microsoft AKS 等)或私有云(On-premises)。
  • 每个模型一个端点,为多个端点提供服务。
  • 与 Prometheus 集成的模型性能监控(持续开发中)。
  • UI仪表板实时监控 ML 模型版本、部署和性能指标(持续开发中)。
  • API与工作流管理器(例如 Apache Airflow)无缝连接,自动化ML工作流(持续开发中)。

目录

快速开始

  1. 使用 docker compose安装 docker 引擎。
  2. 克隆这个存储库并通过 docker compose 启动 ntcore
    docker-compose -f docker-compose.yml up
    
  3. 安装ntcore客户端
    pip install ntcore
    
  4. http://localhost:8000/dsp/console/workspaces 并创建您的第一个工作区。
  5. 模型版本控制。可以从这里了解更多。
    # Load iris dataset.
    from sklearn import datasets
    iris = datasets.load_iris()
    
    # Init the model
    from sklearn.ensemble import RandomForestClassifier
    clf = RandomForestClassifier(max_depth=2, random_state=0)
    
    # Start an experiment run
    from ntcore import Client
    client = Client()
    with client.start_run('my_workspace_id') as exper:
        clf.fit(iris.data, iris.target_names[iris.target], experiment=exper)
  6. 查看模型版本并注册一个用于预生产部署。 Screen Shot 2021-12-20 at 10 08 08 AM

  1. 部署您注册的模型版本并在部署成功后调用 RESTful 端点。
    curl -H "Content-Type: application/json" -X POST --data '{"data": [[5.1,3.5,1.4,0.2]]}' http://localhost:8000/s/{workspace_id}/predict

文档

NTCore 文档: https://docs.thenetron.com/#/zh-cn/.

为什么选择NTCore

假设您是一名数据科学家,为 10 个不同的场景优化 AI/ML 模型,每个场景都需要 100 次迭代。您如何保留这 1000 个实验的输入/输出,比较它们以找到最佳模型并重现它们?这并不容易。但这并不是你噩梦的结束。如果要将“最佳”模型部署为预测端点,则必须重构代码以创建 API,然后 DevOps 团队才能部署。这个过程通常需要几天时间。更重要的是,当这个过程每小时、每天甚至每月重复一次时,疼痛会变得更糟。

NTCore 是一个旨在减轻模型落地痛苦的平台。它提供了 UI 工具和 API,以帮助数据科学家以最少的与 DevOps 团队的互动,将他们训练的模型持续无缝地传送到生产环境。它还提供监控功能,以便数据科学家可以快速访问其模型的最新性能指标。

社区

有关入门指南、教程和 API 参考,请查看我们的文档。

要报告错误、提交文档问题或提交功能请求,请打开 GitHub 问题。

执照

NTCore在Apache 2.0下获得许可.