python-熊猫:将数据写入MySQL时下降了毫秒

我正在尝试将具有毫秒时间戳的DataFrame放入MySQL数据库.但是,这样做时,毫秒部分似乎被删除了.我创建了一个工作示例来说明发生了什么:

import pandas as pd
from sqlalchemy import create_engine # database connection

#Generate date_time with millisecond resolution and price column
df=pd.DataFrame({'date_time' : pd.date_range('1/1/2000 09:00:00', freq="5ms",periods=100),'price' : np.random.random_sample(100)})

#Connect with an empty MysqL database (which I simply created using CREATE DATABASE Trading_db;)
disk_engine = create_engine("MysqL+MysqLdb://root:"+'MYPASSWORD'+"@localhost/Trading_db")

#Dataframe to sql in a Table called Trading_data
df.to_sql('Trading_data', disk_engine, if_exists='replace',index=False)

#When I read this back from MysqL, the milliseconds seem to dissapear
df_sql = pd.read_sql_query('SELECT *'
                   'FROM Trading_data '
                   'LIMIT 20', disk_engine)

将熊猫创建的DataFrame的日期时间与从MysqL加载的日期进行比较:

df.head()

    date_time                   price
0   2000-01-01 09:00:00         0.371986
1   2000-01-01 09:00:00.005000  0.625551
2   2000-01-01 09:00:00.010000  0.631182
3   2000-01-01 09:00:00.015000  0.625316
4   2000-01-01 09:00:00.020000  0.522437

df_sql.head()

    date_time           price
0   2000-01-01 09:00:00 0.371986
1   2000-01-01 09:00:00 0.625551
2   2000-01-01 09:00:00 0.631182
3   2000-01-01 09:00:00 0.625316
4   2000-01-01 09:00:00 0.522437

您可以清楚地看到毫秒数被丢弃.有什么办法可以更改代码以保留毫秒部分?

编辑:我正在使用MysqL Workbench 6.2和pandas 0.14.1

解决方法:

如注释中所述,您需要MysqL v5.6.4来支持小数秒(docs).
但是,正如docs解释的那样,您需要将其显式指定为DATETIME(fsp),其中fsp是小数秒精度,才能在datetime列中启用它.

to_sql中的认值是仅使用DateTime(sqlalchemy datetime类型).但是,您可以使用dtype参数覆盖此认值,并使用MySQL specific DATETIME类型指定精度:

In [11]: from sqlalchemy.dialects.MysqL import DATETIME

In [12]: df.to_sql('Trading_data', engine, dtype={'date_time': DATETIME(fsp=6)}, if_exists='replace', index=False)

In [13]: df_sql = pd.read_sql_query('SELECT * FROM Trading_data', engine)

In [14]: df_sql.head()
Out[14]:
                   date_time     price
0        2000-01-01 09:00:00  0.152087
1 2000-01-01 09:00:00.005000  0.927375
2 2000-01-01 09:00:00.010000  0.540021
3 2000-01-01 09:00:00.015000  0.499529
4 2000-01-01 09:00:00.020000  0.797420

注意:此dtype参数需要使用熊猫0.15.2.

相关文章

转载:一文讲述Pandas库的数据读取、数据获取、数据拼接、数...
Pandas是一个开源的第三方Python库,从Numpy和Matplotlib的基...
整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件...
 一、numpy小结             二、pandas2.1为...
1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta...
1、pandas内置样式空值高亮highlight_null最大最小值高亮背景...