MaxCompute的Logview分析详解

文章目录

  • 一、Logview简介
    • 1、概述
    • 2、标题与功能
    • 3、基础信息
  • 二、作业详情
    • 1、Job Details
    • 2、Fuxi Sensor
    • 3、Result
      • ①当前作业运行成功,显示的为运行结果。
      • ②当前作业运行失败,显示的为失败原因。
    • 4、SourceXML
    • 5、SQL Script
    • 6、History
    • 7、SubStatusHistory
  • 三、分析调优
  • 四、常见报错

一、Logview简介

1、概述

Logview是MaxCompute作业运行状态信息记录与展现的一个工具,目前支持如下功能:

1.支持以交互式DAG图展示作业处理逻辑架构, 查看相应的Operation层级。2.支持回放作业运行过程。3.支持通过Fuxi Sensor查看内存及CPU使用情况。

在这里插入图片描述

2、标题与功能

参考:
分别对应以下功能

MaxCompute作业时生成的唯一作业ID
打开本地保存的作业详情文件Logview_detail.txt。
返回Logview 1.0版界面。
将作业详情文件保存至本地设备。

3、基础信息

在这里插入图片描述

参数描述
MaxCompute Service作业使用的MaxCompute服务的Endpoint。Endpoint详情请参见Endpoint。
Project作业所属的MaxCompute项目名称。
Cloud account提交作业的阿里云账号信息。
Type作业的类型。例如SQL、SQLRT、LOT、XLib、CUPID、AlgoTask和Graph。
Status作业的状态。状态取值如下:
Success:作业执行成功。
Failed:作业执行失败。
Canceled:作业执行取消。
Waiting:作业正在MaxCompute中处理,并没有提交至Fuxi中运行
Running:作业正在Fuxi中处理。
Terminated:作业已执行结束。
Start Time作业提交时间。
End Time作业执行结束时间。
Latency作业执行消耗的时长。
Progress作业执行进度。
Priority作业优先级。
Queue作业在资源配额组内的排队位置。

二、作业详情

在这里插入图片描述

1、Job Details

主要介绍下Fuxi Task

MaxCompute作业由一个或多个Fuxi Job组成。
每个Fuxi Job由一个或多个Fuxi Task组成。
每个Fuxi Task由一个或者多个Fuxi Instance组成

一个MaxCompute作业由一个或多个Fuxi Job组成
Fuxi Job由一个或多个Fuxi Task组成
Fuxi Task由一个或者多个Fuxi Instance组成
MaxCompute作业
Fuxi Job
Fuxi Task
Fuxi Instance

简单的MapReduce通常会产生两个Fuxi Task,一个是Map一个是Reduce,两个Fuxi Task的名称分别为M1和R2,当SQL比较复杂时,可能会产生多个Fuxi Task。

您可以在执行界面上看到每个Fuxi Task的名称。例如M1,表示一个Map Task;R4_3_9的3、9表示它依赖M3、C9_3执行结束才能开始执行。同理,M2_4_9_10_16表示M2要依赖R4_3_9、C9_3、R10_1_16、C16_1四个Task执行结束后才能开始执行。R/W表示Task读取和写的行数。

注意事项:

不支持回放Running状态的Fuxi Task。AlgoTask类型的作业(例如PAI机器学习),由于只有一个Fuxi Task,故不提供作业执行图。非SQL类型作业,仅能展示Fuxi Job和Fuxi Task层,不支持展示Operation层。如果只有一个Fuxi Job,作业执行图默认展示Fuxi Task层依赖关系;否则,默认展示Fuxi Job层依赖关系。

2、Fuxi Sensor

AlgoTask和CUPID类型作业,此区域会提供Sensor列,您可以单击Fuxi Task对应的Sensor查看Fuxi Instance的CPU及内存信息。Fuxi Job分类如下:

M:数据扫描的作业。R:R开头的是Reduce Job。J: J开头的是Join Job。C:C开头的作业是一个虚拟节点,不涉及任何计算,只做判断选择分支使用。

Fuxi Sensor功能在西南1(成都)、华南1(深圳)、华东2(上海)、华东1(杭州)、华北3(张家口)和华北2(北京)区域已开放。

Fuxi Task会有可能因为interrupted状态而重试运行,此时Progress只显示重试运行部分的进度,所以会出现整个作业已经执行成功但是此Fuxi Task的Progress不是100%的现象,此为正常显示。

3、Result

①当前作业运行成功,显示的为运行结果。

如下面命令选择关闭显示运行结果。
setproject odps.forbid.fetch.result.by.bearertoken=true;如下Flag参数改变显示结果样式。
--CSV格式
set odps.sql.select.output.format=csv;
--Text格式
set odps.sql.select.output.format=HumanReadable;

②当前作业运行失败,显示的为失败原因。

4、SourceXML

XML: 在该页签下以XML方式显示作业等级以及Task相关信息。
Settings: 在该页签下显示了当前Task的相关Setting信息。
Command: 在该页签下显示了当前Task的相关Flag设置情况。

5、SQL Script

显示当前Task的SQL运行脚本。

6、History

显示了当前Task的运行历史记录。

7、SubStatusHistory

显示了当前SubTask的运行状态

状态解释
Waiting for scheduling作业已提交,等待MaxCompute框架调度,通常时间很短。
Waiting for cluster resourceMaxCompute框架发现Fuxi计算集群没资源,等待中。
Waiting for concurrent task slotProject级别流控,Project可以设置并行提交SQL个数。
Waiting for data replication等待数据复制。
Waiting for execution slot系统级别流控。
Waiting for cleaning up of previous task attempt等待清理执行历史完成。
Waiting for execution从父进程队列拿出来分发给子进程执行过程,通常很快。
Preparing for execution明确知道交给子进程,如果子进程出问题才会时间长。
Task is executing作业在框架处理中。
SQLTask is initializingSQL作业初始化中。
SQLTask is compiling querySQL作业编译中。
SQLTask is optimizing querySQL作业优化Query,如果执行计划复杂,优化时间会稍长,但过长可能就是出问题了。
SQLTask is splitting data sourcesSQL作业优化中,切分Data Sources。
SQLTask is generating execution planSQL作业生成执行计划中,时间长可能是读取分区太多,或者小文件太多。
SQLTask is submitting execution planSQL作业提交执行计划。
Job has been submitted作业提交计算集群。
Offline Job Waiting for running作业提交计算集群后发现Fuxi集群Quota组无资源,此状态表示作业在等待计算资源。作业提交计算集群前本来以为有计算资源,实际提交后发现无计算资源,就会等待。此状态只会出现一次,后续就算没有计算资源也不会再显示。
Offline Job is runningFuxi作业执行中, 如果运行中无资源,会一直保持该状态。例如高优先级作业抢占资源,导致部分Fuxi Instance不能运行,状态为ready。
Offline Job is failedFuxi作业执行失败。
Offline Job is succeedFuxi作业执行成功。
SQLTask is updating meta informationSQL作业更新元数据信息状态,生成动态分区时,时间可能会稍长。
SQLTask is finishingSQL作业执行结束。
Online Job is cancelled by fuxiService Mode模式被取消。
Task rerun作业重跑,可能是Service Mode模式执行失败,采用离线模式,也可能是数据跨集群复制。
Online Job Waiting for runningService Mode模式等待运行。
Online Job is runningService Mode模式运行中。
Online Job is failedService Mode模式执行失败。
Online Job is succeedService Mode模式运行成功。
Online Job is cancelled by fuxiService Mode模式作业被取消。
Task key-path executing finished作业关键路径完成,但是Detailstatus等尚未完成.
Task key-path is finished作业关键路径完成。
Instance key-path is finishedInstance关键路径完成。
Task execution is finished作业处理完成,生成DetailStatus。
Instance execution is finished作业处理完成。
Execution failed作业执行失败。

三、分析调优

四、常见报错

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.pswp.cn/news/909461.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HTML5白云飘飘动态效果教程

HTML5白云飘飘动态效果教程 这里写目录标题 HTML5白云飘飘动态效果教程效果介绍实现步骤步骤一:创建HTML结构步骤二:设计CSS样式步骤三:添加JavaScript交互 代码解析HTML结构解析CSS样式解析JavaScript功能解析 自定义调整总结 效果介绍 本教…

tcp高难度问题

以下是针对这些问题,在面试场景下,既保证理论扎实、逻辑清晰,又具备交流延展性的回答思路与内容,可根据实际面试节奏和面试官反馈灵活调整展开: 1. 客户端端口号如何确定的? 面试官您好,客户端…

广东省省考备考(第二十八天6.13)—资料分析(第二节课)

基期与现期 官方定义:作为对比参照的是基期,而相对于基期比较的是现期 通俗说法:时间靠前的为基期,时间靠后的为现期 增长量与增长率 增长量用来表述基期量与现期量变化的绝对量; 增长率用来表述基期量与现期量变化…

pytorch 中前向传播和后向传播的自定义函数

系列文章目录 文章目录 系列文章目录一、torch.autograd.function代码实例 在开始正文之前,请各位姥爷动动手指,给小店增加一点访问量吧,点击小店,同时希望我的文章对你的学习有所帮助。本文也很简单,主要讲解pytorch的…

【项目实训#08】HarmonyOS知识图谱前端可视化实现

【项目实训#08】HarmonyOS知识图谱前端可视化实现 文章目录 【项目实训#08】HarmonyOS知识图谱前端可视化实现一、背景简介二、技术方案与架构设计2.1 技术选型2.2 组件架构设计 三、知识图谱可视化组件实现3.1 KGResultTab组件设计组件模板结构不同状态的处理用户交互控制节点…

【软件开发】什么是DSL

什么是DSL DSL(Domain-Specific Language,领域特定语言)是一种为特定领域或任务设计的编程语言,目的在于提高该领域中的表达能力与开发效率。 1 在脚本语言中的 DSL 是什么? 在脚本语言(如 Python、Lua、…

JasperReport生成PDF/A类型文档

当JasperReport导出的文档为PDF/A模式时,该PDF为只读可以防止被修改。 设置导出参数 JRPdfExporter exporter new JRPdfExporter();exporter.setExporterInput(SimpleExporterInput.getInstance(jasperPrints));exporter.setExporterOutput(new SimpleOutputStre…

微信小程序使用画布实现飘落泡泡功能

微信小程序使用画布实现飘落泡泡功能:从组件封装到页面调用的完整实践 先看示例截图: 一、背景与技术选型 在微信小程序中实现类似于飘落的泡泡或者樱花飘落的功能,一般主要有 Canvas 和图片两种方案: (1&#xff…

使用STM32设置GPIO中断

使用S™ 32设置GPIO中断 中断示例按键中断实例设计:EXTI0和EXTI9硬件连接分析STM32代码实现代码说明 中断示例 设计一个按键中断的实例。设置两个中断:EXTI0、EXTI9, 在EXTI9的中断服务之程序中实现LED灯的控制 按键中断实例设计&#xff…

解决在微信小程序中view组件下的text和images设置了样式display: flex; align-items: center;对不齐

原始代码的问题 <view style"display: flex; align-items: center;"><text style"line-height: 1;">全国</text><image src"/images/xia.png" style"height: 20rpx; width: 20rpx; display: block;"></im…

归并排序详解:优雅的分治艺术

什么&#xff1f;归并排序&#xff1f;这让博主想起了大学那会被《数据结构与算法》支配的恐惧… 哈哈言归正传&#xff0c;一直想对算法做一个专栏&#xff0c;因为其实工作中很少很少有机会用到算法&#xff0c;倒是很多工具方法底层会使用&#xff0c;工作被各种需求业务“折…

新零售视域下实体与虚拟店融合的技术逻辑与商业模式创新——基于开源AI智能名片与链动2+1模式的S2B2C生态构建

摘要&#xff1a;新零售的核心在于打破线上线下边界&#xff0c;构建“人、货、场”的全场景融合生态。本文提出&#xff0c;实体线下店与虚拟店的协同发展是新零售的重要演进方向&#xff0c;其底层逻辑在于满足消费者作为“现实人”的体验需求与“虚拟人”的效率需求。通过引…

可视化图解算法51:寻找第K大(数组中的第K个最大的元素)

牛客网 面试笔试 TOP101 | LeetCode 215. 数组中的第K个最大元素 1. 题目 描述 有一个整数数组&#xff0c;请你找出数组中第 k 大的数。 给定一个整数数组 a ,同时给定它的大小n和要找的 k &#xff0c;请返回第 k 大的数(包括重复的元素&#xff0c;不用去重)&…

DataWhale-零基础网络爬虫技术(一)

课程链接先给各位 ↓↓↓ &#xff08;点击即可食用.QAQ Datawhale-学用 AI,从此开始 一、引言 还是在笔记的开始&#xff0c;唠唠一些自己的故事 十年前第一次接触网络&#xff0c;也可以说是第一次接触计算机的时候&#xff0c;那时候还是在中学阶段&#xff0c;那时候大…

Linux02

目录 linux常用命令 用户和权限 压缩和解压缩 其他相关命令 Linux中安装常用软件 1.1. jdk的安装 1.1.1. 卸载linux中自带的open-jdk 1.1.2. 把安装包上传到 linux上 1.1.3. 解压安装包 1.1.4. 配置环境变量 1.1.5 验证环境变量 1.3 安装mysql 1.3.1. 检查依赖 1.…

JavaSE超详细笔记-网络编程篇-基于黑马

1. 什么是网络编程【理解】 1.1 概念 在网络通信协议下&#xff0c;不同计算机上运行的程序&#xff0c;进行的数据传输。 应用场景: 即时通信、网游对战、金融证券、国际贸易、邮件、等等。 不管是什么场景&#xff0c;都是计算机跟计算机之间通过网络进行数据传输Java中可以使…

时序数据库Influxdb3 core安装

本文介绍时序数据库Influxdb3 core(开源版本)的安装和简单使用以及调优参数的介绍。 预期&#xff1a; 安装时序数据库Influxdb3 core 创建数据库mydb 写入数据&#xff1b; 使用influxdb3-cli 和 grafana2种方式查询写入的数据 前期准备&#xff1a; linux服务器(本文服…

区间合并:区间合并问题

区间合并&#xff1a;区间合并问题 区间合并 www.acwing.com/problem/content/805/ 按区间的左端点排序 扫描整个区间&#xff0c;在这过程中把可能有交点的区间合并 全包含&#xff1a;不做改动相交&#xff1a;right 后移相离&#xff1a;更新至下一个维护区间 import j…

中国古代数学符号的演进 | 算筹 / 符号 / 算法

注&#xff1a;本文为“中国古代数学符号”相关合辑。 图片清晰度受引文原图所限。 略作重排&#xff0c;未整理去重。 如有内容异常&#xff0c;请看原文。 这个中国古代的数学瑰宝&#xff0c;到底厉害在哪&#xff1f; 原创 朱一文 科普中国 2024 年 07 月 31 日 15:30 北…

XMLDecoder、LDAP 注入与修复

问题&#xff1a;XMLDecoder注入 针对 xml 解码器的注入攻击 反序列化用户控制的 XML &#xff0c;程序没有进行验证&#xff0c; 会让攻击者有机会在服务器上执行恶意代 码。 例&#xff1a;下面代码片段中&#xff0c; XMLDecoder 处理不可信的输入。 ... XMLDecode…