智灵 Serverless
传统的 GPU 租赁服务,如 AWS EC2 和 Azure VM,通常是按固定时长收费,用户在使用之前需要先行支付费用。而智灵的 Serverless 架构则采用按秒计费的模式,根据实际使用情况动态启动和释放资源,这意味着用户在不使用时无需支付费用,从而显著节省成本。
Serverless 解决什么问题
1. 更低的成本:
提供 Serverless 的 GPU 计算,允许用户按需,按秒付费使用他们的计算资源,按需启动和释放
2. 更快的部署:
基于容器方式, 快速部署,一键选中资源部署
3. 更方便的运维和运营:
提供用户良好的运营数据支撑,包括接入点 API 的吞吐, 延迟、错误率等, 提供弹性灵活的扩容方式和日志查看,帮助用户可以在应对高并发流量时自动进行扩容。
4. 更灵活的应用:
支持多语言的快速部署 Python(第一版优先实现)、Golang、Rust、Java。 提供 cache 方便开发者能快速的使用访问 Huggingface 提供的大模型进行推理。为每个用户的每个无服务提供长久的访问接入点。
5. 更安全的访问:
提供安全的访问接入点,包括身份验证、访问控制、访问日志记录等。