vcf-variant-call-format相关内容

如何使用多个工作人员加速批量导入谷歌云数据存储?

我有一个基于 apache-beam 的数据流作业要使用 vcf source 来自单个文本文件(存储在谷歌云存储中),将文本行转换为数据存储Entities 并将它们写入数据存储接收器.工作流程工作正常,但我注意到的缺点是: 写入数据存储的速度最多约为每秒 25-30 个实体. 我尝试使用 --autoscalingAlgorithm=THROUGHPUT_BASED --numWork ..