当前位置: 首页 > news >正文

腾讯公众微信号西安网站优化推广方案

腾讯公众微信号,西安网站优化推广方案,门户网站开发语言,多地优化调整疫情防控措施文章目录 一. 问题描述二. 解决方案2.1 官方文档2.2 XML格式不规范 一. 问题描述 今天接到一个新需求&#xff0c;hive表里面有个字段存储的是XML类型数据 数据格式: <a><b>bb</b><c>cc</c> </a>二. 解决方案 2.1 官方文档 遇到不懂的…

文章目录

  • 一. 问题描述
  • 二. 解决方案
    • 2.1 官方文档
    • 2.2 XML格式不规范

一. 问题描述

今天接到一个新需求,hive表里面有个字段存储的是XML类型数据

数据格式:

<a><b>bb</b><c>cc</c>
</a>

二. 解决方案

2.1 官方文档

遇到不懂的问题,首先上官方文档查询相关文档,然后照着官网的demo改改,一般就能解决问题了

官方文档地址:
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+XPathUDF
丰富的XML相关函数及测试用例

代码:

-- 求路径 a/b下面的值
SELECT xpath_string ('<a><b>bb</b><c>cc</c></a>', 'a/b') LIMIT 1 ;

测试记录:

hive> > SELECT xpath_string ('<a><b>bb</b><c>cc</c></a>', 'a/b') LIMIT 1 ;
OK
bb
Time taken: 1.477 seconds, Fetched: 1 row(s)
hive> 

2.2 XML格式不规范

因为Hive不支持XML数据格式,后端写入数据库存的是一个String类型,此时格式就没那么规范了,会有一些特殊字符

解析xml报错,原来是有特殊字符
https://stackoverflow.com/questions/730133/what-are-invalid-characters-in-xml

xml不符合规范的字符
https://blog.csdn.net/u014589856/article/details/107151252
image.png

通过正则表达式删除特殊字符:

  1. 下面几个是常用的特殊字符
@&$#%
regexp_replace(the_gifts,'[@&$#%]','')
  1. 只保留 大小写字母 数字 及中文 以及 xml标签
regexp_replace(the_gifts,'(^[a-z]+|[A-Z]+|[0-9]+|[\\u4E00-\\u9FA5]+[</>])','')
http://www.mmbaike.com/news/54913.html

相关文章:

  • 做企业网站项目重庆seo排名优化费用
  • 网页动态设计怎么做宁波seo网站推广
  • 网站不做公安备案线上营销方式
  • 南京网站排名微营销推广软件
  • 工 投标做哪个网站好新浪微博指数查询
  • 昆明网站制作计划百度手机助手
  • 设置网站解析现在做网络推广好做吗
  • 福建龙祥建设集团公司网站深圳网页设计公司
  • 常州外贸网站制作seo优化排名工具
  • 网站恢复怎样在百度上免费建网站
  • 石家庄网站建设联系电话百度广告业务
  • 企业网站空间备案吗武汉大学人民医院光谷院区
  • 网站建设英文关键词优化排名软件s
  • 手机网站欢迎页面app怎么开发出来的
  • 十大代理记账公司泰州网站整站优化
  • 建设报名系统这个网站是真是假ip域名查询网
  • 网站营销有哪些网络营销策划书包括哪些内容
  • wordpress商城开源网站seo推广哪家值得信赖
  • 手机版网站做一下多少钱seo排名赚app
  • 期末作业做网站的心得体会公司软文推广
  • 福州医疗网站建设北京aso优化
  • 北京互联网公司开发的网站营销案例
  • 厦门手机网站建设公司哪家好手机优化大师哪个好
  • 桐柏网站建设百度推广开户怎么开
  • 建设部幼儿园网站首页竹子建站官网
  • 免费一键生成名片北京seo优化排名推广
  • 南宁电子推广网站盘古百晋广告营销是干嘛
  • 广东网站建设服务怎么做品牌推广和宣传
  • 湖南建设信誉查询网站广告公司
  • 企业如何注册自己的网站兰州seo优化