当前位置: 首页 > news >正文

廊坊智能模板建站百度极速版下载

廊坊智能模板建站,百度极速版下载,网站分类标准,东莞寮步网站建设Flink系列之:Table API Connectors之Raw Format 一、Raw Format二、示例三、Format 参数四、数据类型映射 一、Raw Format Raw format 允许读写原始(基于字节)值作为单个列。注意: 这种格式将 null 值编码成 byte[] 类型的 null。这样在 ups…

Flink系列之:Table API Connectors之Raw Format

  • 一、Raw Format
  • 二、示例
  • 三、Format 参数
  • 四、数据类型映射

一、Raw Format

  • Raw format 允许读写原始(基于字节)值作为单个列。
  • 注意: 这种格式将 null 值编码成 byte[] 类型的 null。这样在 upsert-kafka 中使用时可能会有限制,因为 upsert-kafka 将 null 值视为 墓碑消息(在键上删除)。因此,如果该字段可能具有 null 值,我们建议避免使用 upsert-kafka 连接器和 raw format 作为 value.format。
  • Raw format 连接器是内置的。

二、示例

例如,你可能在 Kafka 中具有原始日志数据,并希望使用 Flink SQL 读取和分析此类数据。

47.29.201.179 - - [28/Feb/2019:13:17:10 +0000] "GET /?p=1 HTTP/2.0" 200 5316 "https://domain.com/?p=1" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36" "2.75"

下面的代码创建了一张表,使用 raw format 以 UTF-8 编码的形式从中读取(也可以写入)底层的 Kafka topic 作为匿名字符串值:

CREATE TABLE nginx_log (log STRING
) WITH ('connector' = 'kafka','topic' = 'nginx_log','properties.bootstrap.servers' = 'localhost:9092','properties.group.id' = 'testGroup','format' = 'raw'
)

然后,你可以将原始数据读取为纯字符串,之后使用用户自定义函数将其分为多个字段进行进一步分析。例如 示例中的 my_split。

SELECT t.hostname, t.datetime, t.url, t.browser, ...
FROM(SELECT my_split(log) as t FROM nginx_log
);

相对应的,你也可以将一个 STRING 类型的列以 UTF-8 编码的匿名字符串值写入 Kafka topic。

三、Format 参数

参数是否必选默认值类型描述
format必选(none)String指定要使用的格式, 这里应该是 ‘raw’。
raw.charset可选UTF-8String指定字符集来编码文本字符串。
raw.endianness可选big-endianString指定字节序来编码数字值的字节。有效值为’big-endian’和’little-endian’。

四、数据类型映射

下表详细说明了这种格式支持的 SQL 类型,包括用于编码和解码的序列化类和反序列化类的详细信息。

Flink SQL类型
CHAR / VARCHAR / STRINGUTF-8(默认)编码的文本字符串。
编码字符集可以通过 ‘raw.charset’ 进行配置。
BINARY / VARBINARY / BYTES字节序列本身。
BOOLEAN表示布尔值的单个字节,0表示 false, 1 表示 true。
TINYINT有符号数字值的单个字节。
SMALLINT采用big-endian(默认)编码的两个字节。字节序可以通过 ‘raw.endianness’ 配置。
INT采用 big-endian (默认)编码的四个字节。字节序可以通过 ‘raw.endianness’ 配置。
BIGINT采用 big-endian (默认)编码的八个字节。字节序可以通过 ‘raw.endianness’ 配置。
FLOAT采用 IEEE 754 格式和 big-endian (默认)编码的四个字节。字节序可以通过 ‘raw.endianness’ 配置。
DOUBLE采用 IEEE 754 格式和 big-endian (默认)编码的八个字节。字节序可以通过 ‘raw.endianness’ 配置。
RAW通过 RAW 类型的底层 TypeSerializer 序列化的字节序列。
http://www.mmbaike.com/news/72644.html

相关文章:

  • 在网站上做送餐外卖需要哪些资质什么网站可以免费推广
  • 新公司注册资金多少较好如何进行seo搜索引擎优化
  • 网站设计 上海网络营销策划目的
  • 网页设计网站制作流程做网站好的网站建设公司
  • 图片在线制作二维码网站seo是啥
  • 台州网站制作网页怎么给自己的公司建立网站
  • 苏宁易购网站建设的思路aso优化运营
  • 做网站怎么租个域名seo和sem的区别是什么
  • dedecms5.7装饰网站模板seo优化工程师
  • 学生做的网站成品电商网站订烟平台官网
  • 武汉网站制作德升seo优化是什么意思
  • 做盗版小说网站怎么样上海培训机构白名单
  • 网站建设音乐插件怎么弄哈尔滨最新消息
  • 灌南网站开发指数函数图像及性质
  • 怎么做pdf电子书下载网站宁波seo专员
  • 找人做彩票网站有哪些新浪nba最新消息
  • wordpress回复看内容seo优化资源
  • 网站怎么做dns解析搜索引擎营销的五大特点
  • 网站制作建设公司百度seo优化教程免费
  • 做网站都去哪申请网址关键词排名提高方法
  • 网站收录什么意思商丘网络推广哪家好
  • gucci网站人工智能培训班收费标准
  • 网站开发和数据库哪个有前途宁波seo外包推广渠道
  • 秦皇岛网站制作公司南京seo优化
  • 兰州网站建设网络seo是什么
  • 企石镇做网站网站开发工程师
  • 域名怎么绑定网站怎么创建自己的网站
  • b2b电子商务网站设计对比小程序开发平台有哪些
  • 免费网站在线客服系统域名交易中心
  • 好做网站软文营销案例文章