智灵 Serverless

传统的 GPU 租赁服务，如 AWS EC2 和 Azure VM，通常是按固定时长收费，用户在使用之前需要先行支付费用。而智灵的 Serverless 架构则采用按秒计费的模式，根据实际使用情况动态启动和释放资源，这意味着用户在不使用时无需支付费用，从而显著节省成本。

Serverless 解决什么问题

1. 更低的成本：

提供 Serverless 的 GPU 计算，允许用户按需，按秒付费使用他们的计算资源，按需启动和释放

2. 更快的部署：

基于容器方式，快速部署，一键选中资源部署

3. 更方便的运维和运营：

提供用户良好的运营数据支撑，包括接入点 API 的吞吐，延迟、错误率等，提供弹性灵活的扩容方式和日志查看，帮助用户可以在应对高并发流量时自动进行扩容。

4. 更灵活的应用：

支持多语言的快速部署 Python（第一版优先实现）、Golang、Rust、Java。提供 cache 方便开发者能快速的使用访问 Huggingface 提供的大模型进行推理。为每个用户的每个无服务提供长久的访问接入点。

5. 更安全的访问：

提供安全的访问接入点，包括身份验证、访问控制、访问日志记录等。