火花流关闭没有错误

问题描述

我正在运行一个火花流程序,它会正常运行几个小时,但几个小时后,它就会关闭。 我查看了日志文件(驱动程序和执行程序),但没有发现任何错误。 我想知道它为什么关闭

命令:nohup /home/hadoop/spark-3.0.0/bin/spark-submit --driver-class-path /root/libs/clickhouse-jdbc-0.3.1.jar --jars /root/libs/clickhouse-jdbc-0.3.1.jar --master spark://hadoop-test-01:7077 --total-executor-cores 1 --executor-memory 2g --class SparkMain /root/streaming.jar &> /root/out.log

执行者日志:

2021-07-05 14:59:48,243 INFO memory.MemoryStore:块 taskresult_5954 作为字节存储在内存中(估计大小 1275.5 KiB,空闲 905.4 MiB) 2021-07-05 14:59:48,245 INFO executor.Executor:在阶段 5954.0 (TID 5954) 中完成了任务 0.0。通过 BlockManager 发送的 1306112 字节结果) 2021-07-05 14:59:48,722 INFO executor.CoarseGrainedExecutorBackend:已分配任务 5955 2021-07-05 14:59:48,723 INFO executor.Executor:在阶段 5955.0 (TID 5955) 中运行任务 0.0 2021-07-05 14:59:48,724 INFO broadcast.Torrentbroadcast:开始读取广播变量 5955 1 个(估计总大小 4.0 MiB) 2021-07-05 14:59:48,733 INFO memory.MemoryStore:块 broadcast_5955_piece0 以字节形式存储在内存中(估计大小 952.0 KiB,空闲 911.4 MiB) 2021-07-05 14:59:48,734 INFO broadcast.Torrentbroadcast:读取广播变量 5955 耗时 10 毫秒 2021-07-05 14:59:48,742 INFO memory.MemoryStore:块 broadcast_5955 作为值存储在内存中(估计大小 4.7 MiB,免费 906.7 MiB) 2021-07-05 14:59:48,835 INFO kafka010.KafkaRDD:起始偏移量 2183800 与结束偏移量跳过 ant-spider-autohomeinvoiceprice 0 相同 2021-07-05 14:59:48,841 INFO executor.Executor:在阶段 5955.0 (TID 5955) 中完成了任务 0.0。 1175 字节结果发送给驱动程序 2021-07-05 14:59:48,857 信息存储。BlockManager:删除 RDD 35712 2021-07-05 14:59:54,049 INFO executor.CoarseGrainedExecutorBackend:已分配任务 5956 2021-07-05 14:59:54,050 INFO executor.Executor:在阶段 5956.0 (TID 5956) 中运行任务 0.0 2021-07-05 14:59:54,051 INFO broadcast.Torrentbroadcast:开始读取广播变量 5956 1 个(估计总大小为 4.0 MiB) 2021-07-05 14:59:54,056 INFO memory.MemoryStore:块 broadcast_5956_piece0 以字节形式存储在内存中(估计大小 5.2 KiB,空闲 906.7 MiB) 2021-07-05 14:59:54,058 INFO broadcast.Torrentbroadcast:读取广播变量 5956 耗时 7 毫秒 2021-07-05 14:59:54,059 INFO memory.MemoryStore:块 broadcast_5956 作为值存储在内存中(估计大小 11.1 KiB,免费 906.7 MiB) 2021-07-05 14:59:54,248 INFO jdbc.JDBCRDD:关闭连接 2021-07-05 14:59:54,251 INFO memory.MemoryStore:块 taskresult_5956 以字节形式存储在内存中(估计大小 1275.5 KiB,免费 905.4 MiB) 2021-07-05 14:59:54,252 INFO executor.Executor:在阶段 5956.0 (TID 5956) 中完成了任务 0.0。通过 BlockManager 发送的 1306112 字节结果) 2021-07-05 14:59:54,754 INFO executor.CoarseGrainedExecutorBackend:已分配任务 5957 2021-07-05 14:59:54,754 INFO executor.Executor:在阶段 5957.0 (TID 5957) 中运行任务 0.0 2021-07-05 14:59:54,755 INFO broadcast.Torrentbroadcast:开始读取广播变量 5957 1 个(估计总大小 4.0 MiB) 2021-07-05 14:59:54,764 INFO memory.MemoryStore:块 broadcast_5957_piece0 以字节形式存储在内存中(估计大小 952.0 KiB,空闲 911.4 MiB) 2021-07-05 14:59:54,765 INFO broadcast.Torrentbroadcast:读取广播变量 5957 耗时 9 毫秒 2021-07-05 14:59:54,774 INFO memory.MemoryStore:块 broadcast_5957 作为值存储在内存中(估计大小 4.7 MiB,免费 906.7 MiB) 2021-07-05 14:59:54,877 INFO kafka010.KafkaRDD:起始偏移量 2183800 与结束偏移量跳过 ant-spider-autohomeinvoiceprice 0 相同 2021-07-05 14:59:54,886 INFO executor.Executor:在阶段 5957.0 (TID 5957) 中完成了任务 0.0。 1175 字节结果发送给驱动程序 2021-07-05 14:59:54,900 信息存储。BlockManager:删除 RDD 35724 2021-07-05 15:00:00,055 INFO executor.CoarseGrainedExecutorBackend:已分配任务 5958 2021-07-05 15:00:00,056 INFO executor.Executor:在阶段 5958.0 (TID 5958) 中运行任务 0.0 2021-07-05 15:00:00,057 INFO broadcast.Torrentbroadcast:开始读取广播变量 5958 1 个(估计总大小为 4.0 MiB) 2021-07-05 15:00:00,060 INFO memory.MemoryStore:块 broadcast_5958_piece0 以字节形式存储在内存中(估计大小 5.2 KiB,免费 906.7 MiB) 2021-07-05 15:00:00,067 INFO broadcast.Torrentbroadcast:读取广播变量 5958 耗时 10 毫秒 2021-07-05 15:00:00,068 INFO memory.MemoryStore:块 broadcast_5958 作为值存储在内存中(估计大小 11.1 KiB,免费 906.7 MiB) 2021-07-05 15:00:00,267 信息 jdbc.JDBCRDD:关闭连接 2021-07-05 15:00:00,270 INFO memory.MemoryStore:块 taskresult_5958 以字节形式存储在内存中(估计大小 1275.5 KiB,免费 905.4 MiB) 2021-07-05 15:00:00,272 INFO executor.Executor:在阶段 5958.0 (TID 5958) 中完成了任务 0.0。通过 BlockManager 发送的 1306112 字节结果) 2021-07-05 15:00:00,793 INFO executor.CoarseGrainedExecutorBackend:已分配任务 5959 2021-07-05 15:00:00,793 INFO executor.Executor:在阶段 5959.0 (TID 5959) 中运行任务 0.0 2021-07-05 15:00:00,794 INFO broadcast.Torrentbroadcast:开始读取广播变量 5959 1 个(估计总大小为 4.0 MiB) 2021-07-05 15:00:00,806 INFO memory.MemoryStore:块 broadcast_5959_piece0 以字节形式存储在内存中(估计大小 952.0 KiB,空闲 911.4 MiB) 2021-07-05 15:00:00,807 INFO broadcast.Torrentbroadcast:读取广播变量 5959 耗时 13 毫秒 2021-07-05 15:00:00,815 INFO memory.MemoryStore:块 broadcast_5959 作为值存储在内存中(估计大小 4.7 MiB,免费 906.7 MiB) 2021-07-05 15:00:00,912 INFO kafka010.KafkaRDD:起始偏移量 2183800 与结束偏移量跳过 ant-spider-autohomeinvoiceprice 0 相同 2021-07-05 15:00:00,919 INFO executor.Executor:在阶段 5959.0 (TID 5959) 中完成了任务 0.0。 1175 字节结果发送给驱动程序 2021-07-05 15:00:00,942 INFO storage.BlockManager:删除 RDD 35736 2021-07-05 15:00:06,942 ERROR executor.CoarseGrainedExecutorBackend:执行器自退出,原因是:驱动程序 hadoop-test-01:34255 解除关联!关闭。 2021-07-05 15:00:06,973 ERROR executor.CoarseGrainedExecutorBackend:收到信号条款 由于:驱动程序 hadoop-test-01:34255 已解除关联!正在关闭

驱动日志:

2021-07-05 15:00:00,059 INFO scheduler.TaskSchedulerImpl:添加具有 1 个任务的任务集 5958.0 2021-07-05 15:00:00,059 INFO scheduler.TaskSetManager:在 5958.0 阶段启动任务 0.0(TID 5958、192.168.100.125、执行程序 0、分区 0、PROCESS_LOCAL)字节、7175 2021-07-05 15:00:00,072 INFO storage.BlockManagerInfo:在 192.168.100.125:36774 的内存中添加broadcast_5958_piece0(大小:5.2 KiB,免费:911.4 MiB) 2021-07-05 15:00:00,277 INFO storage.BlockManagerInfo:在 192.168.100.125:36774 的内存中添加了 taskresult_5958(大小:1275.5 KiB,免费:910.1 MiB) 2021-07-05 15:00:00,284 INFO scheduler.TaskSetManager:在 192.168.100.125(执行程序 0)(1/1)的 225 毫秒内完成了阶段 5958.0(TID 5958)中的任务 0.0 2021-07-05 15:00:00,284 INFO scheduler.TaskSchedulerImpl:从池中删除了任务集 5958.0,其任务已全部完成 2021-07-05 15:00:00,285 INFO scheduler.DAGScheduler: ResultStage 5958 (collectAsList at DBUtil.java:57) 在 0.229 秒内完成 2021-07-05 15:00:00,285 INFO scheduler.DAGScheduler:作业 5958 已完成。取消此工作的潜在投机或僵尸任务 2021-07-05 15:00:00,285 INFO scheduler.TaskSchedulerImpl:杀死阶段 5958 中所有正在运行的任务:阶段完成 2021-07-05 15:00:00,285 INFO scheduler.DAGScheduler:作业 5958 完成:在 DBUtil.java:57 collectAsList,耗时 0.229613 秒 2021-07-05 15:00:00,286 INFO storage.BlockManagerInfo:删除了内存中 192.168.100.125:36774 上的 taskresult_5958(大小:1275.5 KiB,免费:911.4 MiB) 2021-07-05 15:00:00,572 INFO spark.SparkContext:开始工作:DBUtil.java 上的 jdbc:80 2021-07-05 15:00:00,573 INFO scheduler.DAGScheduler:有 1 个输出分区的作业 5959(DBUtil.java 上的 jdbc:80) 2021-07-05 15:00:00,573 INFO scheduler.DAGScheduler:最后阶段:ResultStage 5959(DBUtil.java 中的 jdbc:80) 2021-07-05 15:00:00,573 INFO scheduler.DAGScheduler:最后阶段的父母:List() 2021-07-05 15:00:00,573 INFO scheduler.DAGScheduler:缺少父母:List() 2021-07-05 15:00:00,573 INFO scheduler.DAGScheduler:提交 ResultStage 5959(MapPartitionsRDD[35757] at jdbc at DBUtil.java:80),它没有丢失的父母 2021-07-05 15:00:00,694 INFO storage.BlockManagerInfo:删除了内存中 hadoop-test-01:33690 上的 broadcast_5957_piece0(大小:952.0 KiB,免费:366.3 MiB) 2021-07-05 15:00:00,697 INFO storage.BlockManagerInfo:删除了内存中 192.168.100.125:36774 上的 broadcast_5957_piece0(大小:952.0 KiB,免费:912.3 MiB) 2021-07-05 15:00:00,705 INFO storage.BlockManagerInfo:删除了内存中 hadoop-test-01:33690 上的 broadcast_5958_piece0(大小:5.2 KiB,免费:366.3 MiB) 2021-07-05 15:00:00,708 INFO storage.BlockManagerInfo:在内存中删除了 192.168.100.125:36774 上的 broadcast_5958_piece0(大小:5.2 KiB,免费:912.3 MiB) 2021-07-05 15:00:00,783 WARN scheduler.DAGScheduler:广播大小为 4.7 MiB 的大型任务二进制文件 2021-07-05 15:00:00,783 INFO memory.MemoryStore:块 broadcast_5959 作为值存储在内存中(估计大小 4.7 MiB,免费 361.6 MiB) 2021-07-05 15:00:00,796 INFO memory.MemoryStore:块 broadcast_5959_piece0 以字节形式存储在内存中(估计大小 952.0 KiB,免费 360.7 MiB) 2021-07-05 15:00:00,796 INFO storage.BlockManagerInfo:在 hadoop-test-01:33690 的内存中添加broadcast_5959_piece0(大小:952.0 KiB,免费:365.4 MiB) 2021-07-05 15:00:00,797 INFO spark.SparkContext:从 DAGScheduler.scala:1200 的广播创建广播 5959 2021-07-05 15:00:00,797 INFO scheduler.DAGScheduler:从 ResultStage 5959 提交 1 个缺失的任务(MapPartitionsRDD[35757] at jdbc at DBUtil.java:80)(前 15 个任务用于分区 Vector(0)) 2021-07-05 15:00:00,797 INFO scheduler.TaskSchedulerImpl:添加带有 1 个任务的任务集 5959.0 2021-07-05 15:00:00,797 INFO scheduler.TaskSetManager:在 5959.0 阶段启动任务 0.0(TID 5959,192.168.100.125,执行程序 0,分区 0,PROCESS_LOCAL)字节,7255 2021-07-05 15:00:00,812 INFO storage.BlockManagerInfo:在 192.168.100.125:36774 的内存中添加broadcast_5959_piece0(大小:952.0 KiB,免费:911.4 MiB) 2021-07-05 15:00:00,935 INFO scheduler.TaskSetManager:在 192.168.100.125(执行程序 0)(1/1)的 138 毫秒内完成了阶段 5959.0(TID 5959)中的任务 0.0 2021-07-05 15:00:00,935 INFO scheduler.TaskSchedulerImpl:从池中删除了任务集 5959.0,其任务已全部完成 2021-07-05 15:00:00,935 INFO scheduler.DAGScheduler: ResultStage 5959 (jdbc at DBUtil.java:80) 在 0.361 秒内完成 2021-07-05 15:00:00,935 INFO scheduler.DAGScheduler:作业 5959 已完成。取消此工作的潜在投机或僵尸任务 2021-07-05 15:00:00,935 INFO scheduler.TaskSchedulerImpl:杀死阶段 5959 中所有正在运行的任务:阶段完成 2021-07-05 15:00:00,935 INFO scheduler.DAGScheduler:作业 5959 完成:DBUtil.java:80 上的 jdbc,耗时 0.362768 秒 2021-07-05 15:00:00,944 INFO scheduler.JobScheduler:完成作业流作业 1625468400000 ms.0 从作业集时间 1625468400000 ms 2021-07-05 15:00:00,944 INFO scheduler.JobScheduler:总延迟:0.944 秒,时间 1625468400000 毫秒(执行:0.937 秒) 2021-07-05 15:00:00,944 INFO kafka010.KafkaRDD:从持久性列表中删除 RDD 35736 2021-07-05 15:00:00,947 INFO scheduler.ReceivedBlockTracker:删除批次: 2021-07-05 15:00:00,947 INFO scheduler.InputInfoTracker:删除旧的批处理元数据:1625468388000 毫秒 2021-07-05 15:00:00,949 信息存储。BlockManager:删除 RDD 35736

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...