当前位置: 首页 > news >正文

企业网站怎么做产品图片轮播近期出现的病毒叫什么

企业网站怎么做产品图片轮播,近期出现的病毒叫什么,wordpress core主题,做网站的职位微调模型是为了让模型在特殊领域表现良好,帮助其学习到专业术语等。 本文采用llama_index框架微调BGE模型,跑通整个流程,并学习模型微调的方法。 已开源:https://github.com/stay-leave/enhance_llm 一、环境准备 Linux环境,GPU L20 48G,Python3.8.10。 pip该库即可。…

微调模型是为了让模型在特殊领域表现良好,帮助其学习到专业术语等。

本文采用llama_index框架微调BGE模型,跑通整个流程,并学习模型微调的方法。
已开源:https://github.com/stay-leave/enhance_llm

一、环境准备

Linux环境,GPU L20 48G,Python3.8.10。
pip该库即可。

二、数据准备

该框架实现了读取各种类型的文件,给的示例就是pdf。
在这里插入图片描述
因此准备了一些网络舆情相关的论文pdf,选择70%作为训练数据,剩下作为验证数据。都放在data文件夹下。
在这里插入图片描述

三、微调脚本编写

1.读取数据

使用SimpleDirectoryReader类读取文件。
读取到文本后,使用SentenceSplitter将一个很长的文档切分为若干块。
每一块设置的有token数和重叠token数,在
在这里插入图片描述可以自选,默认的chunk_size大小没找到在哪,重叠的是200.
在这里插入图片描述以上是库的源码实现,我们调用是很简单的。VAL_CORPUS_FPATH 我一开始以为是在load_corpus里的某个类自动保存,结果根本没有。所以自己写了导出为json的函数,是将其text数据保存了。

# 源文件 列表
my_list = [i for i in os.listdir('project_2/data') if i.endswith('pdf')]
# 随机抽取70%的数据,作为训练集
random.shuffle(my_list) # 打乱
num_to_sample = int(len(my_list) * 0.7) # 阈值
# 构造本地文件路径
training_set = [f"project_2/data/{file}" for file in my_list[:num_to_sample]] # 训练集文件list
validation_set = [f"project_2/data/{file}" for file in my_list[num_to_sample:]] # 验证集文件list# 最终形成的训练和验证语料
TRAIN_CORPUS_FPATH = 'project_2/data/corpus/train_corpus.json'
VAL_CORPUS_FPATH = 'project_2/data/corpus/val_corpus.json'# 读取pdf数据,节点
def load_corpus(files, verbose=False):if verbose:print(f"正在加载文件 {files}")reader = SimpleDirectoryReader(input_files=files)docs = reader.load_data()if verbose:print(f"已加载 {len(docs)} 个文档")parser = SentenceSplitter()nodes = parser.get_nodes_from_documents(docs, show_progress=verbose)if verbose:print(f"已解析 
http://www.mmbaike.com/news/106058.html

相关文章:

  • 营销型网站建设与网页设计网络站点推广的方法有哪些
  • com网站怎么注册怎么发布信息到百度
  • 新网站怎么做才会被收录百度快照优化排名推广怎么做
  • 做网站加载速度有什么方法邵阳seo优化
  • 磁力链接 网站怎么做的怎样申请网站注册
  • 外贸平台哪个网站最好知乎国内能用的搜索引擎
  • seo怎么做网站优秀案例今天今日新闻头条最新消息
  • 网站管理的含义交换链接是什么意思
  • 创意网站开发百度关键词优化大师
  • 景德镇网站建设公司网站seo快速优化
  • 网络公司网站建设网站生成app工具
  • 工信部网站备案查询百度一下官方网
  • 做网站的材料win11优化大师
  • 石狮网站设计公司google adwords
  • 上海建网站开发公广告软文是什么意思
  • php网站搬家软件百度权重排名查询
  • 山阴县2017建设局网站新站整站快速排名
  • 网站的支付系统怎么做怎么申请网站
  • 织梦生成手机网站百度地图导航网页版
  • 网站建设运营合同模板厦门seo蜘蛛屯
  • 网站漏洞扫描服务网络搜索引擎有哪些
  • 商标局网站可以做变更吗百度问答官网
  • tom企业邮箱seo资源网站排名
  • 自己做国际网站德州seo优化
  • 365元做网站成品ppt网站国外
  • dw怎么做秋季运动会网站页面seo优化
  • 政府部门网站建设内容网络广告人社区
  • 美国做爰直播网站如何优化seo
  • 优惠券网站开发站长工具seo综合查询columbu cat
  • asp做网站安全性桂林网站设计