avro相关内容

向融合模式注册注册AVRO模式

可以将AVRO模式注册到融合模式注册服务吗? 根据github 上的自述文件 https://github.com/confluentinc/schema-registry 每个示例都使用具有单个字段和类型且没有任何名称的JSON模式。 我正在尝试将以下架构存储到存储库中,但是不同的变体会得到不同的错误。 curl -X POST -H“内容类型:application ..

Kafka连接器和架构注册表-检索Avro架构时出错-找不到主题

我有一个主题,最终将有许多不同的架构。现在,它只有一个。 我已经通过REST这样创建了一个连接作业: { “ name”:“ com.mycompany.sinks.GcsSinkConnector-auth2“, ” config“:{ ” connector.class“:” com.mycompany.sinks.GcsSinkConnector“, ” topics“:” aut ..

在SQL(Athena)中进行嵌套:如何将结构数组转换为从结构中提取的值数组?

我正在从贝叶斯统计模型中提取样本,使用Avro对其进行序列化,将其上传到S3,然后使用Athena进行查询。 我需要帮助来编写查询取消嵌套表中的数组。 CREATE TABLE查询看起来像: CREATE EXTERNAL TABLE` model_posterior`(( `job_id` bigint, `model_id` bigint, `parents array ..
发布时间:2020-06-03 23:06:58 其他开发

avro模式中的可选数组

我想知道是否可以有一个可选数组. 让我们假设这样的模式: { "type": "record", "name": "test_avro", "fields" : [ {"name": "test_field_1", "type": "long"}, {"name": "subrecord", "type": [{ " ..
发布时间:2020-05-21 21:49:22 其他开发

嵌套Avro模式

根据此问题,有关嵌套Avro模式,嵌套记录架构的正确方法如下: { "name": "person", "type": "record", "fields": [ {"name": "firstname", "type": "string"}, {"name": "lastname", "type": "string"}, ..
发布时间:2020-05-17 01:12:21 其他开发

是否可以使用AVRO为Kafka中的Google Pub/Sub主题定义架构?

据我所知,我们可以在Kafka上定义AVRO模式,用该模式定义的主题将仅接受与该模式匹配的数据.在接受队列之前验证数据结构非常有用. Google Pub/Sub中是否有类似内容? 解决方案 Kafka本身不验证架构,因此主题固有地没有一对字节数组和一些元数据以外的架构.在数据到达主题之前,是序列化程序是生产客户端的一部分,它执行验证.同样,在一天结束时,在PubSub中,它仅存储/ ..
发布时间:2020-05-09 01:30:50 其他开发

无法调用avro-maven插件

我的问题类似于无法使用Maven从.avsc编译并创建.avro文件 我已经尝试了所有可能的方法,检查了maven项目100次,但仍然无法运行avro-maven插件来为我的avsc文件生成代码. 我已经阅读了以下帖子,并且遵循相同的内容,但没有成功 http://grepalex.com/2013/05/24/avro-maven/ https://github.com/phunt/ ..
发布时间:2020-05-07 23:50:48 其他开发

带MRUnit的Avro提供InstantiationException

我正在使用: hadoop-client 2.2.0 mrunit 1.0.0 avro 1.7.6 avro-mrunit 1.7.6 ......整个内容正在使用Maven构建和测试. 直到按照在序列化中具有Avro NullPointerException的MRUnit的说明,我才收到NullPointerException . 现在我收到一个Instantia ..
发布时间:2020-05-07 22:33:03 其他开发

在Scala中导入Avro模式

我正在编写一个简单的Twitter程序,其中我正在使用Kafka阅读推文,并希望使用Avro进行序列化.到目前为止,我刚刚在Scala中设置了twitter配置,现在想使用此配置读取tweet. 如何在程序中导入文件tweets.avsc中定义的以下avro模式? { "namespace": "tweetavro", "type": "record", "na ..
发布时间:2020-05-07 21:39:45 其他开发

无法在Pig中加载Avro模式

我有一个Avro架构,并且正在将具有该架构的数据写入AvroSequenceFileOutputFormat.我查看了文件,可以确认该模式已在其中读取.我叫这个函数 avro = load 'part-r-00000.avro' using AvroStorage(); 它给我错误信息 ERROR org.apache.pig.tools.grunt.Grunt - ERROR ..
发布时间:2020-05-05 15:53:13 其他开发

Avro入门

我想开始将Avro与Map Reduce一起使用.有人可以建议一个好的入门教程/示例吗?我无法通过互联网搜索找到很多东西. 解决方案 我最近做了一个项目,该项目很大程度上基于Avro数据,并且以前没有使用过这种数据格式,所以我不得不从头开始.您是对的,在开始使用Avro时,很难从在线资源中获得很多帮助.我向您推荐的材料是: 到目前为止,我发现的最有用的资源是汤姆·怀特(Tom Whi ..
发布时间:2020-05-05 15:35:56 其他开发

从大型csv创建词典列表

我有一个很大的csv文件(10 gb),我想阅读它并创建一个词典列表,其中每个字典代表csv中的一行. 像 [{'value1': '20150302', 'value2': '20150225','value3': '5', 'IS_SHOP': '1', 'value4': '0', 'value5': 'GA321D01H-K12'}, {'value1': '20150302', ' ..
发布时间:2020-05-05 14:30:44 Python

一台NettyServer的Avro RPC多个响应器

我正在研究Avro RPC,并且试图创建一个简单的示例以更好地理解它. 但是我面临一个困难:我不能在一个服务器上运行多个Responder,因为NettyServer构造函数只允许我使用一个服务器: public NettyServer(Responder responder, InetSocketAddress addr) 因此,如果我有多个IDL,例如: @namespa ..
发布时间:2020-04-26 12:50:01 其他开发

Avro通过JSON转换生成类问题[kotlin]

我在编组/解组 avro 生成的类时遇到了一个奇怪的问题.我遇到的错误是抛出非枚举错误-除非我的班级中没有任何枚举. 错误具体是这样的: com.fasterxml.jackson.databind.JsonMappingException:不是枚举:{"type":"record","name":"TimeUpdateTopic","namespace":"org.company.m ..
发布时间:2020-04-26 12:33:58 Java开发