很多 Python 表格处理脚本不是输在read_excel或to_csv,而是输在前面没有先确认:这批表到底应该有哪些字段、哪些字段必填、哪些值属于异常、异常行要怎么留痕。结果脚本看起来跑完了,交付出去以后才发现漏列、空值、金额格式、日期格式一堆问题。今天这篇用一个很小的订单表案例,先把“字段字典、空值检查、异常行导出”这套流程跑通,后面你换成销售表、库存表、客户表也能直接改字段复用。一、为什么处理表格前要先做字段字典?很多人拿到一批 Excel / CSV 后,会先写:importpandasaspd df=pd.read_csv("raw_orders.csv"
[Python实战] 处理一批表格前,怎样先做字段字典、空值检查和异常行导出?
很多 Python 表格处理脚本不是输在read_excel或to_csv,而是输在前面没有先确认:这批表到底应该有哪些字段、哪些字段必填、哪些值属于异常、异常行要怎么留痕。结果脚本看起来跑完了,交付出去以后才发现漏列、空值、金额格式、日期格式一堆问题。今天这篇用一个很小的订单表案例,先把“字段字典、空值检查、异常行导出”这套流程跑通,后面你换成销售表、库存表、客户表也能直接改字段复用。一、为什么处理表格前要先做字段字典?很多人拿到一批 Excel / CSV 后,会先写:importpandasaspd df=pd.read_csv("raw_orders.csv"