Excel数据处理工具(KKC每月表格导出)
工具概述
这是一个专门用于处理Excel文件的桌面应用程序,主要针对集装箱物流数据进行处理和分析。该工具可以读取特定格式的Excel文件,进行数据清洗、转换和分析,并生成包含多个工作表的输出文件。
功能特点
- 智能文件处理:自动识别.xls和.xlsx文件格式,选择合适的处理引擎
- 数据格式修复:特别针对日期格式进行智能处理和修复
- 多维度数据分析:生成多个工作表,从不同角度分析数据
- 用户友好界面:简洁直观的操作界面,一键式处理
- 错误处理机制:完善的异常捕获和错误提示
系统要求
- Python 3.6+
- 依赖库:tkinter, pandas, openpyxl, xlrd
安装依赖
pip install pandas openpyxl xlrd
使用说明
- 运行程序,界面显示"Excel数据处理工具 v6.0"
- 点击"导入Excel文件"按钮,在弹出的文件选择对话框中选择要处理的Excel文件
- 程序自动处理数据并生成output.xlsx文件在程序所在目录
- 处理完成后,状态栏会显示"处理成功!输出文件:output.xlsx"
- 如需退出程序,点击"退出程序"按钮
输入文件要求
输入的Excel文件必须包含以下列(从第4行开始):
- 箱号
- 动态
- 动态时间
- 经营人
- 尺寸
- 箱型
- 进出口空重
- 提单号
- 英文船名
- 航次
- 中文船名
- 船代码
- 抵离港日期
数据处理流程
1. 数据读取与预处理
- 从第4行开始读取数据(header=3)
- 自动选择适合的引擎(xlrd或openpyxl)
- 对特定列进行格式转换:
- 航次:转为字符串并去除空格
- 提单号:转为字符串
- 尺寸:转为字符串
- 智能处理日期格式,无效日期转为NaT
- 验证必要列是否存在
2. 输出文件工作表说明
Sheet1:原始数据
保留原始数据中的必要列,按原格式输出。
Sheet2:尺寸分析
- 创建"格式化日期"列,将日期转为YYYYMMDD格式
- 生成"合并列",格式为:日期_英文船名_航次
- 创建透视表,按"合并列"分组,统计不同尺寸的箱子数量
Sheet3:DCHE筛选
筛选"动态"列中包含"DCHE"的记录,保留所有原始列。
Sheet4:提单分析
- 基于Sheet3(DCHE数据)进行分析
- 筛选有效日期的记录
- 按"合并列"(日期_英文船名_航次)分组
- 统计每组的唯一提单号数量和总出现次数
- 如无DCHE相关数据,则输出提示信息
错误处理
程序会捕获并显示以下类型的错误:
- 文件格式错误
- 缺少必要列
- 数据处理过程中的异常
错误信息会以红色文字显示在状态栏。
注意事项
- 输出文件将保存在程序运行目录下,命名为"output.xlsx"
- 如果已存在同名文件,将被覆盖
- 处理大文件可能需要一定时间,请耐心等待