7.atlas安装

1.服务器规划

软件版本参考:
https://cloud.google.com/dataproc/docs/concepts/versioning/dataproc-release-2.2?hl=zh-cn
由于hive3.1.3不完全支持jdk8,所以将hive的版本调整成4.0.1。这个版本没有验证过,需要读者自己抉择。

所有的软件都安装再/opt/apps下。

2.预先准备

hadoop集群
hive集群
kafka集群
zookeeper集群
hbase集群

3.相关组件安装

3.1 solr集群安装

修改配置

修改/opt/apps/solr/bin/solr.in.sh,打开注释或者新增配置。

ZK_HOST="instance-kafka01:2181,instance-kafka02:2181,instance-kafka03:2181"
SOLR_HOST="instance-hbase01"
SOLR_JETTY_HOST="0.0.0.0"

solr的zookeeper地址,本地ip或者hostname, 允许其他节点访问。

分发
将solr安装包分发到需要安装的机器上,并将solr.in.sh配置里面的SOLR_HOST改成本机。

SOLR_HOST="instance-hbase01"

启动

配置环境变量后,在每一台机器上执行下面命令。

solr start

访问任意一台机器,8983端口,出现以下界面为安装成功。
在这里插入图片描述

补充
要集成atlas, solr9.2.1需要在对应的zk上增加一个额外的目录。

create /clusterstate.json {}

3.atlas安装

3.1 解压

把前文中编译好的压缩包,上传到服务器,然后解压。找到apache-atlas-2.2.0-server.tar.gz解压到/opt/apps

tar -zxvf apache-atlas-2.2.0-server.tar.gz -C /opt/apps/

改名为atlas.
找到apache-atlas-2.2.0-hive-hook.tar.gz解压到/opt/apps,并且改名为atlas-hive-hook

tar -zxvf apache-atlas-2.2.0-hive-hook.tar.gz -C /opt/apps/

3.2 配置

配置路径在/apache-atlas-2.2.0/conf。

3.2.1 集成HBase

atlas-application.properties,新增或者打开注释。配置Hbase配置的zk地址。

atlas.graph.storage.hostname=mecury-schedule-v1-m-0:2181,mecury-schedule-v1-m-1:2181,mecury-schedule-v1-m-2:2181

atlas-env.sh 配置hbase配置目录。

export HBASE_CONF_DIR=/opt/apps/hbase/conf

3.2.2 集成Solr

atlas-application.properties。配置solr配置的zk地址。

atlas.graph.index.search.solr.zookeeper-url=instance-kafka01:2181,instance-kafka02:2181,instance-kafka03:2181

创建相应的collection.

/opt/apps/solr/bin/solr create -c vertex_index -d /opt/apps/atlas/conf/solr -shards 3 -replicationFactor 2
/opt/apps/solr/bin/solr create -c edge_index -d /opt/apps/atlas/conf/solr -shards 3 -replicationFactor 2
/opt/apps/solr/bin/solr create -c fulltext_index -d /opt/apps/atlas/conf/solr -shards 3 -replicationFactor 2

对于atlas-2.2.0的配置文件有点问题,包含弃用的对象。执行上面命令前,需要调整。
/opt/apps/atlas/conf/solr/schema.xml

<fieldType name="location" class="solr.LatLonType" subFieldSuffix="_coordinate"/>```
修改为```bash
<fieldType name="location" class="solr.LatLonPointSpatialField"/>

3.2.3 集成kafka

atlas-application.properties。配置kafka集群地址和数据目录。

atlas.kafka.data=/opt/data/atlas/kafka
atlas.kafka.zookeeper.connect=instance-kafka01:2181,instance-kafka02:2181,instance-kafka03:2181/kafka
atlas.kafka.bootstrap.servers=instance-kafka01:9092,instance-kafka02:9092,instance-kafka03:9092

3.2.4 atlas 配置

配置atlas地址和hbase zookeeper地址。

atlas.rest.address=http://instance-hbase11:21000
# If enabled and set to true, this will run setup steps when the server starts
atlas.server.run.setup.on.start=false
atlas.audit.hbase.zookeeper.quorum=mecury-schedule-v1-m-0:2181,mecury-schedule-v1-m-1:2181,mecury-schedule-v1-m-2:2181

打开这段注释

 <!-- Uncomment the following for perf logs --><!--<appender name="perf_appender" class="org.apache.log4j.DailyRollingFileAppender"><param name="file" value="${atlas.log.dir}/atlas_perf.log" /><param name="datePattern" value="'.'yyyy-MM-dd" /><param name="append" value="true" /><layout class="org.apache.log4j.PatternLayout"><param name="ConversionPattern" value="%d|%t|%m%n" /></layout></appender><logger name="org.apache.atlas.perf" additivity="false"><level value="debug" /><appender-ref ref="perf_appender" /></logger>-->

3.2.5 集成hive

atlas-application.properties,增加。

######### Hive Hook Configs #######
atlas.hook.hive.synchronous=false
atlas.hook.hive.numRetries=3
atlas.hook.hive.queueSize=10000
atlas.cluster.name=primary

拷贝atlas-hive-hook到atlas.

cp -r atlas-hive-hook/* atlas/

修改hive-site.xml,增加

  <property><name>hive.exec.post.hooks</name><value>org.apache.atlas.hive.hook.HiveHook</value></property>

修改hive-env.sh,增加

export HIVE_AUX_JARS_PATH=/opt/apps/atlas-hive-hook/hook/hive

将atlas-application.properties复制到hive/conf目录下。

4.启动

进入atlas目录。

bin/atlas_start.py

启动成功后,访问21000可以登录。就表示成功。
初始账号和密码都是admin。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/diannao/85109.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c# 获取电脑 分辨率 及 DPI 设置

using System; using System.Collections.Generic; using System.Diagnostics; using System.IO; using System.Runtime.InteropServices;/// <summary> /// 这个可以 /// </summary> class Program {static void Main(){//设置DPI感知try{SetProcessDpiAwareness(…

LangChain表达式(LCEL)实操案例1

案例1&#xff1a;写一篇短文&#xff0c;然后对这篇短文进行打分 from langchain_core.output_parsers import StrOutputParser from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder from langchain_core.runnables import RunnableWithMessageHist…

OleDbParameter.Value 与 DataTable.Rows.Item.Value 的性能对比

OleDbParameter.Value 与 DataTable.Rows.Item.Value 的性能对比 您提到的两种赋值操作属于不同场景&#xff0c;它们的性能和稳定性取决于具体使用方式。下面从几个维度进行分析&#xff1a; 1. 操作本质对比 &#xff08;1&#xff09;OleDbParameter.Value 用途&#xf…

【Opencv+Yolo】Day2_图像处理

目录 一、图像梯度计算 图像梯度-sobal算子&#xff1a; Scharr&#xff1a;权重变化更大&#xff08;线条更加丰富&#xff0c;比Sobel更加细致捕捉更多梯度信息&#xff09; Laplacian算子&#xff1a;对噪音点敏感&#xff08;可以和其他一起结合使用&#xff09; 二、边…

STM32通过rt_hw_hard_fault_exception中的LR寄存器追溯程序问题​

1. 问题现象 程序运行导致rt_hw_hard_fault_exception 如图 显示错误相关代码 struct exception_stack_frame {uint32_t r0;uint32_t r1;uint32_t r2;uint32_t r3;uint32_t r12; uint32_t lr; // 链接寄存器 (LR)uint32_t pc; // 程序计数器 (PC)uint32_t psr; // 程序状态…

Mac安装配置InfluxDB,InfluxDB快速入门,Java集成InfluxDB

1. 与MySQL的比较 InfluxDBMySQL解释BucketDatabase数据库MeasurementTable表TagIndexed Column索引列FieldColumn普通列PointRow每行数据 2. 安装FluxDB brew update默认安装 2.x的版本 brew install influxdb查看influxdb版本 influxd version # InfluxDB 2.7.11 (git: …

【spring】spring中的retry重试机制; resilience4j熔断限流教程;springboot整合retry+resilience4j教程

在调用三方接口时&#xff0c;我们一般要考虑接口调用失败的处理&#xff0c;可以通过spring提供的retry来实现&#xff1b;如果重试几次都失败了&#xff0c;可能就要考虑降级补偿了&#xff1b; 有时我们也可能要考虑熔断&#xff0c;在微服务中可能会使用sentinel来做熔断&a…

(21)量子计算对密码学的影响

文章目录 2️⃣1️⃣ 量子计算对密码学的影响 &#x1f30c;&#x1f50d; TL;DR&#x1f680; 量子计算&#xff1a;密码学的终结者&#xff1f;⚡ 量子计算的破坏力 &#x1f510; Java密码学体系面临的量子威胁&#x1f525; 受影响最严重的Java安全组件 &#x1f6e1;️ 后…

经营分析会,财务该怎么做?

目录 一、业绩洞察&#xff1a;从「现象描述」到「因果分析」 1.分层拆解 2.关联验证 3.根因追溯 二、预算管理&#xff1a;从「刚性控制」到「动态平衡」 1.分类管控 2.滚动校准 3.价值评估 三、客户与市场&#xff1a;从「交易记录」到「价值评估」 1.价值分层 2.…

进阶智能体实战九、图文需求分析助手(ChatGpt多模态版)(帮你生成 模块划分+页面+表设计、状态机、工作流、ER模型)

🧠 基于 ChatGPT 多模态大模型的需求文档分析助手 本文将介绍如何利用 OpenAI 的 GPT-4o 多模态能力,构建一个智能的需求文档分析助手,自动提取功能模块、菜单设计、字段设计、状态机、流程图和 ER 模型等关键内容。 一、🔧 环境准备 在开始之前,请确保您已经完成了基础…

图书管理系统的设计与实现

湖南软件职业技术大学 本科毕业设计(论文) 设计(论文)题目 图书管理系统的设计与实现 学生姓名 学生学号 所在学院 专业班级 毕业设计(论文)真实性承诺及声明 学生对毕业设计(论文)真实性承诺 本人郑重声明:所提交的毕业设计(论文)作品是本人在指导教师的指导下,独…

直线模组在手术机器人中有哪些技术挑战?

手术机器人在现代医疗领域发挥着越来越重要的作用&#xff0c;直线模组作为其关键部件&#xff0c;对手术机器人的性能有着至关重要的影响。然而&#xff0c;在手术机器人中使用直线模组面临着诸多技术挑战&#xff0c;具体如下&#xff1a; 1、‌高精度要求‌&#xff1a;手术…

技术-工程-管用养修保-智能硬件-智能软件五维黄金序位模型

融智学工程技术体系&#xff1a;五维协同架构 基于邹晓辉教授的框架&#xff0c;工程技术体系重构为&#xff1a;技术-工程-管用养修保-智能硬件-智能软件五维黄金序位模型&#xff1a; math \mathbb{E}_{\text{技}} \underbrace{\prod_{\text{Dis}} \text{TechnoCore}}_{\…

InnoDB引擎逻辑存储结构及架构

简化理解版 想象 InnoDB 是一个高效运转的仓库&#xff1a; 核心内存区 (大脑 & 高速缓存 - 干活超快的地方) 缓冲池 Buffer Pool (最最核心&#xff01;)&#xff1a; 作用&#xff1a; 相当于仓库的“高频货架”。把最常用的数据&#xff08;表数据、索引&#xff09;从…

贫血模型与充血模型:架构设计的分水岭

在企业级应用的架构设计中&#xff0c;贫血模型和充血模型一直是架构师们争论的热点话题。两者背后分别代表着“事务脚本模式”和“领域模型模式”两种截然不同的设计思想。而理解这两者的差异&#xff0c;有助于开发者根据实际业务场景做出更合理的架构决策。 贫血模型&#…

Linux的调试器--gbd/cgbd

1.引入 #include <stdio.h> int Sum(int s, int e) {int result 0;for(int i s; i < e; i){result i;}return result; } int main() {int start 1;int end 100;printf("I will begin\n");int n Sum(start, end);printf("running done, result i…

PPIO × AstrBot:多平台接入聊天机器人,开启高效协同 | 教程

在消息平台接入专属聊天机器人&#xff0c;能快速生成精准答案&#xff0c;与项目管理、CRM等系统集成后&#xff0c;机器人还能根据任务进展自动建群、推送进度提醒&#xff0c;并精准相关人员&#xff0c;实现信息的高效传递。 AstrBot 是一个多平台聊天机器人及开发框架&…

HAProxy 可观测性最佳实践

HAProxy 简介 HAProxy&#xff08;High Availability Proxy&#xff09;是一款广泛使用的高性能负载均衡器&#xff0c;支持 TCP 和 HTTP 协议&#xff0c;提供高可用性、负载均衡和代理服务。它特别适用于负载较大的 Web 站点&#xff0c;能够支持数以万计的并发连接&#xf…

增强LangChain交互体验:消息历史(记忆)功能详解

背景 在构建聊天机器人时,将对话状态传入和传出链至关重要。 LangGraph 实现了内置的持久层,允许链状态自动持久化在内存或外部后端(如 SQLite、Postgres 或 Redis)中。在本文我们将演示如何通过将任意 LangChain runnables 包装在最小的 LangGraph 应用程序中来添加持久性…

EasyRTC音视频实时通话助力微信小程序:打造低延迟、高可靠的VoIP端到端呼叫解决方案

一、方案概述​ 在数字化通信浪潮下&#xff0c;端到端实时音视频能力成为刚需。依托庞大用户生态的微信小程序&#xff0c;是实现此类功能的优质载体。基于WebRTC的EasyRTC音视频SDK&#xff0c;为小程序VoIP呼叫提供轻量化解决方案&#xff0c;通过技术优化实现低延迟通信&a…