Oceanbase下使用TPC-H模式生成数据

1.下载tpc-h

http://www.tpc.org/

点击下载始终弹出这个画面,尝试了多种方法无效,最后选择科学上网工具,才正常下载。

通过网盘分享的文件:TPC-H-Toolv3.zip
链接: https://pan.baidu.com/s/14CXrp7v_7XkPtXfFLkziBQ?pwd=qf5t 提取码: qf5t 
--来自百度网盘超级会员v8的分享

2. 编译TPCH基准工具

直接解压安装包TPC-H-Tool.zip

编辑项目定义的头文件TPC-H V3.0.1/dbgen/tpcd.h,不同的数据库使用不用的定义。文件中内置了一些数据库,本示例使用obmysql,所以选择添加mysql定义,如下:

#ifdef MYSQL

#define GEN_QUERY_PLAN  ""

#define START_TRAN      "start transaction"

#define END_TRAN        "commit"

#define SET_OUTPUT      ""

#define SET_ROWCOUNT    "limit %d;\n"

#define SET_DBASE       "use %s;\n"

#endif

2.2. 修改编译文件

编译文件 TPC-H V3.0.1/dbgen/makefile.suite,找到如下内容按情况修改,CC行添加gcc、DATABASE/MACHINE/WORKLOAD添加参数,如下:
################

## CHANGE NAME OF ANSI COMPILER HERE

################

CC      = gcc        

DATABASE= MYSQL

MACHINE = LINUX

WORKLOAD = TPCH

2.3. 执行编译

上述2个文件配置完成后,TPC-H V3.0.1/dbgen/ 执行 make 命令(gcc提前安装好)

编译完成后会自动生成2个执行文件

  • dbgen:生成表数据(csv文件)
  • qgen:生成复杂查询SQL

2.4 生成数据

在dbgen目录下,使用如下命令生成.tbl数据文件。在本例中,-s 1表示生成1GB的数据。如果需要生成10GB的数据,将1改为10即可。

./dbgen -s 1

执行上述命令后,dbgen工具将开始生成数据文件并保存在当前目录下。生成的数据文件包括8个表,分别是:supplier.tbl、region.tbl、part.tbl、partsupp.tbl、orders.tbl、nation.tbl、lineitem.tbl、customer.tbl。

2.5 obloader导入数据

[root@ocp dbgen]# /root/ob-loader-dumper-4.3.4-RELEASE/bin/obloader -h 192.192.103.125 -P2883 -uroot@test#test_ob_cluster -p 'Root_1234'  -D obcp4 --cut --all  -f '/root/ob-loader-dumper-4.3.4-RELEASE/ext' --file-suffix 'tbl' --thread 8

2025-09-17 20:44:29 [INFO] Parsed args:

[--cut] true

[--file-path] /root/ob-loader-dumper-4.3.4-RELEASE/ext

[--file-suffix] tbl

[--thread] 8

[--host] 192.192.103.125

[--port] 2883

[--user] root@test#test_ob_cluster

[--password] ******

[--database] obcp4

[--sys-user] root

[--all] true

初次导入报错,检查ob-loader-dumper.bad日志,发现字段的包裹符为|,同时行记录结尾也有|,需要屏蔽掉,添加参数-trail-delimiter

[root@ocp dbgen]# /root/ob-loader-dumper-4.3.4-RELEASE/bin/obloader -h 192.192.103.125 -P2883 -uroot@test#test_ob_cluster -p 'Root_1234'  -D obcp4 --cut --all  -f '/root/ob-loader-dumper-4.3.4-RELEASE/ext' --column-separator '|' --file-suffix 'tbl' --thread 8 -trail-delimiter

其他用法参考文档:

https://www.hikunpeng.com/document/detail/zh/kunpengdbs/testguide/tstg/kunpengtpch_02_0005.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/98280.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/98280.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 面试经典 150_哈希表_单词规律(41_290_C++_简单)

LeetCode 面试经典 150_哈希表_单词规律(41_290_C_简单)题目描述:输入输出样例:题解:解题思路:思路一(哈希表):代码实现代码实现(思路一(哈希表&a…

librespeed c++ 上传下载带宽测试 排坑全流程

在搭建 LibreSpeed 测速服务并实现基于 curl/API 的上传下载测试时,遇到 Nginx 配置冲突、PHP 权限异常等问题。本文将梳理从环境搭建到功能验证的全流程,针对 “curl 上传报 404/405”“PHP-FPM 权限拒绝”等典型问题,提供可复现的解决方案。…

重读生成概率模型1----基础概念

1 KL 散度 KL 散度的作为是描述两个分布的差异的,首先是度量一个分布,用熵来度量。 1.1 熵 在介绍熵之间,首先要度量单个事件的信息量 I(x)−logP(x)I(x)-logP(x)I(x)−logP(x) 整体的信息量 H(P)Ex P[−logP(x)]−∑P(x)logP(x) \begin{alig…

排查解决磁盘占用高问题(容器挂载的磁盘)

最近遇到磁盘占用高的告警,记录一下解决的思路。 首先是系统触发告警,通知我们某台机器磁盘占用高。(或其他途径得知) 通过XShell登录该机器。 执行df-h命令查看挂载占用情况找到真正占用高的挂载点挂载点/home目录占用高&#xf…

流体(1)

流体 Minecraft 中的流体(Fluid),也常被称为液体(Liquid),是一类能够自由流动、形成河流、瀑布或湖泊的特殊方块。它们的行为基于简化的流体力学,是游戏世界中动态环境的重要组成部分。 💧 流体是什么? 在 Minecraft 中,流体核心特点包括: 源方块与流动:每个流…

机器学习-卷积神经网络(CNN)

全连接层->卷积层 用有一个隐藏层的MLP训练ImageNet数据集(300*300的图像,有1000个类别),要有10000个输出 会有10亿个可学习的参数,量太大 全连接:一个输出是根据所有输入加权得到在图片中识别物体&…

Ubuntu 磁盘扩容与扩容失败问题解决( df -h 与 GParted 显示空间不一致的问题 -LVM)

在管理 Linux 磁盘时,你是否遇到过这样的困惑:正常扩容之后,发现GParted 显示某个分区还有几十 GiB 可用,但 df -h 却提示该分区已接近满额?这种 “空间幻觉” 背后是系统存储管理的分层设计,本文将从原理到…

PyQt5中QLineEdit控件数值显示与小数位数控制

在PyQt5应用程序开发中,QLineEdit控件常用于显示和编辑文本内容。当需要用它来显示数值并控制小数位数时,开发者需要掌握一些特定的技巧。本文将深入探讨几种实现方法,每种方法都附带完整独立的代码示例。 数值格式化基础 在Python中&#xf…

LangChain使用方法以OpenAI 的聊天模型GPT-4o为例

以使用 OpenAI 的聊天模型(如 GPT-4)为例,从设置环境、初始化模型、调用模型到处理响应的各个方面进行介绍: 1. 环境设置 安装 langchain-openai 包。设置环境变量 OPENAI_API_KEY,用于认证(以linux为例&am…

Oracle为数据大表创建索引方案

在日常业务中,避免不了为数据量大表补充创建索引的情况,如果快速、有效地创建索引成了一个至关重要的问题(注意:虽然提供有ONLINE在线执行的方式,理想状态下不会阻塞DML操作,但ONLINE在开始、结束的两个时刻…

网站服务相关问题

目录 HTTP常见的状态码 http和https的区别以及使用的端口号 http处理请求的过程 https认证过程 正向代理和反向代理的区别 HTTP常见的状态码 HTTP(超文本传输协议)定义了一系列的状态码,用于表示客户端请求的处理结果。以下是一些常见的…

Go并发编程实战:深入理解Goroutine与Channel

Go并发编程实战:深入理解Goroutine与ChannelGo并发编程实战:深入理解Goroutine与Channel概述1. 为什么是Go的并发?从“线程”与“协程”说起2. Goroutine:如何使用?3. Channel:Goroutine间的安全通信创建与…

2025服贸会“海淀之夜”,点亮“科技”与“服务”底色

2025年9月12日傍晚,北京颐和园,十七孔桥旁,2025年中国国际服务贸易交易会“海淀之夜”如约而至。在“海淀之夜”,科技机构、金融机构、咨询服务机构、出海服务企业以及跨国企业和国际友人等,将目光聚焦于此。被第三方机…

qt使用camke时,采用vcpkg工具链设置VTK的qt模块QVTKOpenGLNativeWidget

下载:QVTKOpenGLNativeWidget嵌入qt应用中资源-CSDN下载 1.通过vcpkg安装VTK,目前的VTK里面默认为qt6,如果需要安装qt5,需要将端口配置进行修改 笔者的vcpkg的vtk端口路径:D:\vcpkg\ports\vtk portfile.cmake 修改点: #第一处 #file(READ "${CURRENT_INSTALLED_DIR}/sh…

Axios在鸿蒙应用开发中的使用

目录一、简介二、安装与配置三、axios用法1.axios泛型参数(1).第三个泛型参数-约束data请求参数的类型(2).第二个泛型参数-决定后台返回数据的类型2.axios拦截器3.请求工具封装统一处理业务状态码错误统一处理401或404错误一、简介 Axios 是一个基于 Promise 的网络请求库&…

第九周文件上传

文件上传漏洞 不同的网站要不同的webshell。我们使用是php开发的网站。 一服务器白名单绕过 服务端白名单(Whitelist)是⼀种安全机制,它只允许预定义的合法元素通过(只有有限的元素进入),其他所有内容默认被拒绝。相比黑名单&am…

计算机视觉必读论文:从经典到前沿

计算机视觉必读论文:从经典到前沿 一、前言 二、经典论文解读​ 2.1 图像分类​ 2.1.1 《ImageNet Classification with Deep Convolutional Neural Networks》(AlexNet)​ 2.1.2 《Very Deep Convolutional Networks for Large-Scale Image Recognition》(VGGNet)​ 2.1.…

对比PowerBI的字段参数,QuickBI的已选字段还有改进的空间

对比PowerBI的字段参数,QuickBI的已选字段还有改进的空间 之前分享过QuickBI的已选字段 vs PowerBI的字段参数,QuickBI可以在表格中实现PowerBI的字段参数效果,甚至比PowerBI实现的过程和使用方式更丝滑。 但如果应用到图形中会怎么样呢&am…

飞算JavaAI:Java开发新时代的破晓之光

免责声明:此文章的所有内容皆是本人实验测评,并非广告推广,并非抄袭。如有侵权,请联系,谢谢!【#飞算JavaAl炫技赛】 【#Java开发】摘要:飞算JavaAI作为全球首款聚焦Java的智能开发助手&#xff…

vulntarget-c靶场内网渗透

1. 环境搭建 2.对ubuntu20的渗透 对其进行端口扫描 访问80端口 发现是laravel框架。版本是v8.78.1 使用 kaili 自带的msf 进行渗透 search laravel use exploit/multi/php/ignition_laravel_debug_rce执行利用完成检测 上传木马 先将木马进行base64编码 <?php eval($_P…