文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

python批量插入数据到mysql

2023-09-06 13:04

关注

使用python批量插入数据到mysql的三种方法

自动化单条insert

# -*- coding:utf-8 -*-import timefrom pymysql import *# 装饰器,计算插入50000条数据需要的时间def timer(func):    def decor(*args):        start_time = time.time()        func(*args)        end_time = time.time()        d_time = end_time - start_time        print("the running time is : ", d_time)    return decor@timerdef add_test_users():    conn = connect(host='主机名', port='端口号', user='用户名', password='密码', database='数据库名', charset='utf8')    cs = conn.cursor()  # 获取游标    for num in range(0, 58000):        try:            sql = "insert into '表名'(字段名) values(值)"            cs.execute(sql)        except Exception as e:            return                conn.commit()  # 提交    cs.close()    conn.close()    print('OK')add_test_users()

拼接sql语句,只执行一次insert

# -*- coding:utf-8 -*-import timefrom pymysql import *# 装饰器,计算插入50000条数据需要的时间def timer(func):    def decor(*args):        start_time = time.time()        func(*args)        end_time = time.time()        d_time = end_time - start_time        print("the running time is : ", d_time)    return decor@timerdef add_test_users():        usersvalues = []    for num in range(1, 50000):        usersvalues.append(('需要插入的字段对应的value'))  # 注意要用两个括号扩起来    conn = connect(host='主机名', port='端口号', user='用户名', password='密码', database='数据库名', charset='utf8')    cs = conn.cursor()  # 获取光标    # 注意这里使用的是executemany而不是execute,下边有对executemany的详细说明    cs.executemany('insert into '表名'(字段名) values(%s,%s,%s,%s)', usersvalues)    conn.commit()    cs.close()    conn.close()    print('OK')add_test_users()

使用这种批量插入方式插入5w条数据用时大约不到1秒

另外,针对executemany
execute(sql) : 接受一条语句从而执行
executemany(templet,args):能同时执行多条语句,执行同样多的语句可比execute()快很多,强烈建议执行多条语句时使用executemany
templet : sql模板字符串,  例如 ‘insert into table(id,name,age) values(%s,%s,%s)’
args: 模板字符串中的参数,是一个list,在list中的每一个元素必须是元组!!!  例如: [(1,‘mike’),(2,‘jordan’),(3,‘james’),(4,‘rose’)]

使用load data infile 加载到mysql

需要注意的是,这种方式本来是在mysql里边执行的命令,而这里是用代码实现的命令

如果是在linux下,需要进行下边几个步骤

在桌面写个文本文件,里边的内容对应下边的数据表字段即可
在这里插入图片描述
在这里插入图片描述

cd /var/lib/mysql-files/
切换到这个目录,将文本文件移动到这个目录下,如果不在这个目录下执行的话加载的时候会出现错误,当然也可以选择修改mysql配置,只不过这种方法相对比较简单

对应load data infile 可以在mysql里边直接执行文件即可
load data infile ‘/var/lib/mysql-files/data.txt’ into table ‘表名’(字段名)     这个命令

load data [low_priority] [local] infile ‘file_name txt’ [replace | ignore]
into table tbl_name
[fields
[terminated by’t’]
[OPTIONALLY] enclosed by ‘’]
[escaped by’’ ]]
[lines terminated by’n’]
[ignore number lines]
[(col_name, )]

这个是load data infile的完整命令,带[ ]的是可选参数 下面解释几个比较常用的参数
[terminated by’t’] 这个意思就是文本字段里边以什么分隔
如果文本文件是这样:

小一,12,男
小二,13,女
小三,12,男

那么就是应该terminated by ’ , ’ ,不设置默认的就是制表符分隔,上边定义的文本文件正好也就是制表符,因此没有做设置,按照的就是默认值

==enclosed by == 这个的意思是字段是以什么包裹着
如果文本文件是这样:

“小一”,“12”,“男”
“小二”,“13”,“女”
“小三”,“12”,“男”

那么参数就应该这样写:enclosed by “”

综合以上三种方法比较,第三种方法效率最高,因此建议用第三种方

python向mysql插入大量数据时注意事项

通过python向mysql插入大量数据时:

for + cursor.execute(sql),最后集中提交(commit())

cursor.executemany(sql,list)

两种方法效率上和功能上有一定差异。26万条数据,使用第一种方法需要约1.5小时,使用第二种方法只需要10几秒。

executemany的用法:import pymysqllist_1 = [('a',1),('b',2),(None,3)]  # 元素是不是元组都可以sql_1 = 'insert into 表明(字段1,字段2) values(%s,%s)' # 注意,这里的%s不需要加引号,使用execute需要加引号。# 另外,executemany 在执行过程中能够将python的None转为sql的nulldb = pymysql.connect(host= ....)cursor = db.cursor()cursor.executemany(sql_1,list_1)db.commit()cursor.close()db.close()print('完成')


二、自动提交

在创建连接的时候,增加参数 autocommit = 1 ,当发生update等操作时,会实时更新到数据库内。否则要通过 conn.commit() 来提交到数据库进行具体操作。

如果没有设置自动提交,也没有手动提交,当进行插入或更新等操作时,只在本地客户端能看到更新,在其他客户端或数据库内,数据无变化。

# 实时操作,适合随时少量、频繁的更新
 

import pymysqlconn = pymysql.connect(    host='XXX.XXX.XXX.XXX',     user='XXXXX',     password='XXXXX',     db='XXXXX',     port=3306,     charset='utf8',    autocommit = 1 ,    ) # 集中大批量操作数据 import pymysqlconn = pymysql.connect(    host='XXX.XXX.XXX.XXX',     user='XXXXX',     password='XXXXX',     db='XXXXX',     port=3306,     charset='utf8',    ) SQl相关操作略 conn.commit()  # 提交



原文链接:https://blog.csdn.net/pxx000000/article/details/126600034

来源地址:https://blog.csdn.net/qq_35224503/article/details/130333778

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     801人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     348人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     311人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     432人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     220人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-数据库
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯