引入 gcloud 存储:Cloud Storage 的数据传输速度提高了 94%

Cloud Storage 客户经常向我们询问从他们的存储桶中提取和检索数据的最快方法。获得最佳性能通常需要用户知道正确的标志和参数以优化传输速度。在许多情况下,客户将 Cloud Storage 与其他 Google Cloud 服务一起使用,并且正在寻找一种可用于管理其所有 Google Cloud 资产的工具。

介绍 gcloud 存储 – Google Cloud CLI 的最新成员

Google Cloud CLI(又名 gcloud CLI)可用于直接在命令行或通过脚本创建和管理 Google Cloud 资源和服务。Gcloud 存储是该集合的最新成员,它使 Cloud Storage 的 CLI 体验现代化。

数据传输性能

数据传输率对客户来说很重要,因为他们决定了数据的使用率,以获得对其业务有用的洞察力。与现有的 gsutil 选项相比,新的 gcloud storage CLI 提供了显着的性能改进,后者是一个 Python 应用程序,可让您通过 CLI 访问 Cloud Storage。

为了展示 gsutil 和 gcloud 存储选项之间的性能差异,我们测试了单文件和多文件方案。在传输 100 个大小为 100MB 的文件时,gcloud 存储的下载速度比 gsutil 快 79%,使用并行复合上传策略的上传速度快 33%。请参见图 1。对于 10GB 文件,gcloud 存储在下载时比 gsutil 快 94%,在上传时快 57%。请参见图 2。这些测试是在 Google Cloud Platform 上使用 n2d-standard-16(8 个 vCPU,32 GB 内存)和 RAID0 中的 1x375GB NVME 在 us-east4 中执行的。
更快的传输速率是 gcloud 存储中两项主要创新的结果。首先,gcloud 存储使用更快的散列工具进行 CRC32C 数据完整性检查,从而跳过了 gsutil 所需的复杂设置。其次,它利用了一种新的并行化策略,将任务管理视为一个图形问题,从而可以以更少的开销并行完成更多的工作。

提高可用性

除了 gcloud CLI 提供的性能改进之外,它还提供了一种一致的方式来管理所有 Google Cloud 资源,例如 Cloud Storage 存储桶、Compute Engine 虚拟机和 Google Kubernetes Engine 集群。

gcloud 存储会自动检测最佳设置并加快传输速度,而无需用户提供任何标记。在 gcloud 存储中,所有操作都是并行发生的。例如,基于存储桶配置自动启用并行复合上传。与 gsutil 相比,这是一个巨大的改进,gsutil 需要 -m(并行操作)标志来提高上传和下载的性能。

gcloud storage 显着减少了用户管理其 Cloud Storage 资源所需的顶级命令的数量。这是通过在公共标头下对命令进行分组来实现的 – 所有存储桶操作都归类在 gcloud storage buckets <command> 下,所有对象操作都归类在 gcloud storage objects <command> 下。

过渡到 gcloud storage CLI 很简单,因为我们引入了一个shim,它使现有 gsutil 脚本能够作为 gcloud 存储执行。这使您无需为 Cloud Storage 重写任何现有的 gsutil 脚本即可获得新 CLI 的所有性能优势。

启用 gcloud 存储

gcloud storage CLI 目前可用,您可以免费使用它。您可以安装或升级到最新版本的Google Cloud SDK以获取新的 CLI。

要了解有关 gcloud storage CLI 的更多信息,您可以联系MeshCloud,我们的公有云架构师将向您解答并协助您完成配置。

MeshCloud 拥有 Google Cloud Premier Partner 资质,是 Google Cloud 在亚太区服务客户数和收入规模双领先的合作伙伴;团队拥有几十张谷歌云专家证书,同时拥有多个 Google Cloud Specialization 资质。

MeshCloud 同时为客户提供云原生定制化开发服务,为客户提供具体场景的云解决方案和软件交付。

发表评论

您的电子邮箱地址不会被公开。