当前位置: 首页 > news >正文

腾讯公众微信号seo网络推广

腾讯公众微信号,seo网络推广,商务网站开发实训报告,如何做网站的关键词排名文章目录 一. 问题描述二. 解决方案2.1 官方文档2.2 XML格式不规范 一. 问题描述 今天接到一个新需求&#xff0c;hive表里面有个字段存储的是XML类型数据 数据格式: <a><b>bb</b><c>cc</c> </a>二. 解决方案 2.1 官方文档 遇到不懂的…

文章目录

  • 一. 问题描述
  • 二. 解决方案
    • 2.1 官方文档
    • 2.2 XML格式不规范

一. 问题描述

今天接到一个新需求,hive表里面有个字段存储的是XML类型数据

数据格式:

<a><b>bb</b><c>cc</c>
</a>

二. 解决方案

2.1 官方文档

遇到不懂的问题,首先上官方文档查询相关文档,然后照着官网的demo改改,一般就能解决问题了

官方文档地址:
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+XPathUDF
丰富的XML相关函数及测试用例

代码:

-- 求路径 a/b下面的值
SELECT xpath_string ('<a><b>bb</b><c>cc</c></a>', 'a/b') LIMIT 1 ;

测试记录:

hive> > SELECT xpath_string ('<a><b>bb</b><c>cc</c></a>', 'a/b') LIMIT 1 ;
OK
bb
Time taken: 1.477 seconds, Fetched: 1 row(s)
hive> 

2.2 XML格式不规范

因为Hive不支持XML数据格式,后端写入数据库存的是一个String类型,此时格式就没那么规范了,会有一些特殊字符

解析xml报错,原来是有特殊字符
https://stackoverflow.com/questions/730133/what-are-invalid-characters-in-xml

xml不符合规范的字符
https://blog.csdn.net/u014589856/article/details/107151252
image.png

通过正则表达式删除特殊字符:

  1. 下面几个是常用的特殊字符
@&$#%
regexp_replace(the_gifts,'[@&$#%]','')
  1. 只保留 大小写字母 数字 及中文 以及 xml标签
regexp_replace(the_gifts,'(^[a-z]+|[A-Z]+|[0-9]+|[\\u4E00-\\u9FA5]+[</>])','')
http://www.mmbaike.com/news/54209.html

相关文章:

  • 卫浴网站模板免费企业网站管理系统
  • 东莞市网络公司seo推广哪家公司好
  • 北京做机柜空调的网站关键词推广效果
  • 英文网站建设注意什么专业的推广公司
  • 做游戏破解版的网站东莞整站优化推广公司找火速
  • 国外看新闻app推荐seo新手入门教程
  • 金乡做网站 亿九品牌运营策划方案
  • 网络营销方式研究心得1500seo站内优化公司
  • 软件设计师中级seo培训机构
  • 西安市做网站2021最新免费的推广引流软件
  • 合肥网站制作开发哪个杭州seo好
  • 微信小程序好看的ui界面seo 优化
  • 50强网站建设公司人民日报最新头条10条
  • 句容建设路幼儿园网站怎么把网站排名排上去
  • 西安做建站的公司企业网站seo公司
  • 前端官网模板最新seo黑帽技术工具软件
  • 自己怎样制作网站培训机构网站设计
  • 重庆电商平台网站建设关键词排名怎样
  • 百度制作的wordpress工具win10优化大师怎么样
  • 外贸移动商城网站建设seo网络推广方法
  • 做商贸生意的人都去什么网站河源市企业网站seo价格
  • 做网站需要字体切换seo 技术优化
  • 门头沟区专业网站制作网站建设北京seo公司
  • 公司名称大全两个字seo排名怎么看
  • 合肥网络公司 网站建设优化软件刷排名seo
  • 文化网站策划书内容百度问答怎么赚钱
  • php网站开发环境一互联网推广怎么找渠道
  • 调研报告 政府网站建设百度小程序优化
  • 鞍山网站开发bing搜索引擎入口官网
  • 蓝色网站建设公司网站建设方案