网易首页 > 网易号 > 正文 申请入驻

实时获取股票数据,免费!——Python爬虫Sina Stock实战

0
分享至

更多量化内容,欢迎关注公众号:数量技术宅。

想要获取本期文中的完整策略,欢迎添加技术宅个人微信号:sljsz01,sljsz05。已加入知识星球会员也可直接在知识星球内获取本文源码。(知识星球优惠链接请见文末)

01

实时股票数据的重要性

对于四大可交易资产:股票、期货、期权、数字货币来说,期货、期权、数字货币,可以从交易所提供的api收到实时行情数据,而股票由于量化交易接口不面向普通人开放,导致大家想要获取到股票的实时数据,十分困难。而与此同时,股票实时数据,又是极其重要的场内交易数据。

对于手动交易者而言,实时数据一方面可以辅助盯盘,另一方面,可以用程序简单开发到价提醒,到某个价位,进行入场和出场的交易。

对于量化交易者,实时行情就更加重要了。我们接收实时行情之后,不仅需要用实时数据计算策略信号,而且当策略信号需要对某个股票进行下单的时候,我们也需要知道该股票的最新价格、盘口数据,从而根据价格+盘口,选择合适的价位下单。此外,实时数据落地后,还可以为我们的策略回测服务。

02

爬虫最通俗的原理解释

爬虫,相当于模仿了网页查询的动作,比如我们在浏览器中输入了www.baidu.com,浏览器向我们返回百度的主页,其实这就是一个请求+返回的过程。我们请求的是地址,返回的是数据(尽管我们看到的是百度主页,其实背后对应的还是一些列的数据,只不过后续的可视化展示成了网页)。

对于请求股票数据来说,也是同理。比如我们请求某一只股票的数据(以600000浦发银行为例),在浏览器地址中输入:http://hq.sinajs.cn/list=sh600000,股票代码可任意修改,浏览器返回如下数据集并显示:

当然同时查询多只股票,也是可以做到的,我们同样在浏览器中输入地址,例如:http://hq.sinajs.cn/list=sh600000,sz000001,sz000002,就同时查询到了浦发银行、平安银行、万科A的数据。

那么,对于Python来说,我们如何使用Python来模仿网页查询的动作?这里必须要借助一个Python的三方库:request库。

requests是使用Apache2 licensed 许可证的HTTP库。Request支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动响应内容的编码,支持国际化的URL和POST数据自动编码。可以说,requests在python内置模块的基础上进行了高度的封装,从而使得python进行网络请求时,变得人性化,使用Requests可以轻而易举的完成浏览器可有的任何操作。与此同时,requests会自动实现持久连接keep-alive。

requests库的上述优点,加上其使用的便捷性,使得其成为Python爬虫的首选工具。我们通过requests,来重复一遍上述网页的查询过程,步骤也很简单,首先查询单个股票,返回如下

再次查询多个股票,返回如下,可以看到,用requests进行查询所返回的结果,与我们网页上看到的是完全一致的,这也说明requests完美的模拟了浏览器的请求动作。

03

Python爬虫Sina Stock实战

第一步,Sina API + Requests库调用核心函数

通过调用Sina Stock API,实时查询股票价格。我们采用多股票查询,使用requests请求接口。

核心函数逻辑:code传入股票代码,调用requests库进行查询,并解析查询结果,得到我们想要查询的股票最新价格、当日涨跌幅、昨收盘价等关键字段

第二步,通过threading多线程同时查询结果、通过Queue实现线程池

我们简要介绍一下threading和Queue。threading模块中包含了关于线程操作的丰富功能,包括:常用线程函数,线程对象,锁对象,递归锁对象,事件对象,条件变量对象,信号量对象,定时器对象,栅栏对象。threading.Thread:线程对象,重要方法,start():开启线程活动。它将使得run()方法在一个独立的控制线程中被调用,需要注意的是同一个线程对象的start()方法只能被调用一次,如果调用多次,则会报RuntimeError错误。run():此方法代表线程活动。

Python的Queue模块中提供了同步的、线程安全的队列类,包括FIFO(先入先出)队列Queue,LIFO(后入先出)队列LifoQueue,和优先级队列PriorityQueue。这些队列都实现了锁原语,能够在多线程中直接使用。可以使用队列来实现线程间的同步。Queue.put(item) 写入队列;Queue.get([block[, timeout]])获取队列

第三步,模块化实现:Worker类 & Stock类

Worker类,主要实现功能:

  1. 传入线程实例对象,调用init、start方法,重载run函数

  2. work_queue存放要查询的队列,依次取出(FIFO),查询结果存到result_queue队列,当队列满,取出结果队列中所有查询结果,并打印

Stock类,主要实现功能:

  1. 初始化生产者、消费者队列,生产者队列为空,消费者队列最大数量是查询的股票数量

  2. 按预设的线程数据,初始化线程池,绑定Worker类

  3. 对于每次每只要查询的股票,加入生产者队列

  4. 定义爬虫获取数据的函数

最后,我们调用Worker类和Stock类,就能得到想要获取的结果了。

04

运行结果展示

程序不仅可以获取个股数据,也能够获取指数数据,我们默认订阅了上证指数、深圳综指、万科A、浦发银行,4个数据流,以下是默认运行结果的展示,我们打印了最新价、涨跌幅、昨收价等关键数据。我们按照一定的时间间隔,获取数据并打印。

程序的扩展:在主程序入口,可修改查询的股票数量,我们支持多股票同时查询;查询的时间间隔、查询的线程数量的修改。

当然,我们也可以对该爬虫程序做后续的进一步拓展,比如计算量化策略信号,落地数据作为回测数据,等等。

如果你想要获取这个Python爬虫Sina Stock程序,欢迎扫码添加技术宅的个人微信sljsz01或sljsz05,领取完整代码。

欢迎加入数量技术宅知识星球:量化学院,知识星球每日更新,内有更多量化干货,等着你来学习。量化学院=公众号全策略+星球独家量化干货+答疑+日更。欢迎订阅量化学院,用一年的时间,做一件让自己感动的事。

量化学院知识星球优惠链接

往期干货

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
如果毛主席没有写出《沁园春·雪》,他还可以靠哪首词名扬天下?

如果毛主席没有写出《沁园春·雪》,他还可以靠哪首词名扬天下?

优趣纪史记
2026-03-02 19:04:55
新加坡住了一年才敢说:被吹上天的居者有其屋,其实是一地鸡毛

新加坡住了一年才敢说:被吹上天的居者有其屋,其实是一地鸡毛

天下霸奇
2026-02-24 08:09:25
赢7分!杨毅却批评主教练郭士强:将中国男篮的优势给丢了

赢7分!杨毅却批评主教练郭士强:将中国男篮的优势给丢了

体育哲人
2026-03-01 22:40:43
伊朗宣布斩首以色列空军司令,摧毁法国海军基地!

伊朗宣布斩首以色列空军司令,摧毁法国海军基地!

胜研集
2026-03-02 00:05:34
女子回湖北婆家过年,车被妯娌砸稀烂,竟牵扯上孩子,原因太炸裂

女子回湖北婆家过年,车被妯娌砸稀烂,竟牵扯上孩子,原因太炸裂

社会日日鲜
2026-03-01 08:30:01
仅6分钟19个导弹连全军覆没,82架战机被击落给我们敲响警钟

仅6分钟19个导弹连全军覆没,82架战机被击落给我们敲响警钟

阿光的技巧课堂
2026-02-02 23:59:53
英超近10轮拿分情况:曼联22分第1 阿森纳21分第2 热刺4分垫底

英超近10轮拿分情况:曼联22分第1 阿森纳21分第2 热刺4分垫底

智道足球
2026-03-02 08:22:53
他接受纪律审查和监察调查

他接受纪律审查和监察调查

锡望
2026-03-02 12:47:11
明星过年大型 “卸妆现场”!全员恢复出厂设置,最接地气竟是他

明星过年大型 “卸妆现场”!全员恢复出厂设置,最接地气竟是他

艺能八卦局
2026-03-01 09:00:30
1928年,杨宇霆被枪决前和张学良合影,注意看站姿,早已分道扬镳

1928年,杨宇霆被枪决前和张学良合影,注意看站姿,早已分道扬镳

浩渺青史
2026-01-11 10:36:36
美伊冲突最极端的结果要来了…

美伊冲突最极端的结果要来了…

风风顺
2026-03-02 08:11:44
9金4银!中国队跳水世界杯加拿大站完美收官

9金4银!中国队跳水世界杯加拿大站完美收官

北青网-北京青年报
2026-03-02 10:45:02
内贾德大难不死,伊朗反击不设限,又有一国参战,沙特骗了中国?

内贾德大难不死,伊朗反击不设限,又有一国参战,沙特骗了中国?

荷兰豆爱健康
2026-03-02 15:47:08
一大批外国人被迫滞留新加坡:机场成“难民所”、陆路堵超2小时

一大批外国人被迫滞留新加坡:机场成“难民所”、陆路堵超2小时

新加坡万事通
2026-03-02 19:04:00
俄乌战争为何无法调停?——谁都输不起

俄乌战争为何无法调停?——谁都输不起

高博新视野
2025-12-02 19:11:53
舒淇在节目里第一次承认,她和冯德伦为要孩子已经折腾了整整九年

舒淇在节目里第一次承认,她和冯德伦为要孩子已经折腾了整整九年

南权先生
2025-12-05 16:25:34
国家电网投资 4 万亿,核心受益股名单

国家电网投资 4 万亿,核心受益股名单

风风顺
2026-01-17 09:24:05
伊朗反击,不设红线!以色列怎么也没想到,自己才是最大冤大头

伊朗反击,不设红线!以色列怎么也没想到,自己才是最大冤大头

混沌录
2026-03-02 00:18:37
绝命师血战三十万敌军,仅团长一人幸存,自觉无颜见人;毛主席问道:为何不来见我?

绝命师血战三十万敌军,仅团长一人幸存,自觉无颜见人;毛主席问道:为何不来见我?

史海孤雁
2026-03-02 16:42:13
辽宁推妻坠海案中,死者儿子案发后的举动,才叫人头皮发麻…

辽宁推妻坠海案中,死者儿子案发后的举动,才叫人头皮发麻…

媒体人溪婉
2024-11-29 13:57:59
2026-03-02 21:24:49
数量技术宅 incentive-icons
数量技术宅
爱好数据分析量化投资的技术宅
269文章数 211关注度
往期回顾 全部

科技要闻

荣耀发布机器人手机、折叠屏、人形机器人

头条要闻

特朗普称对伊行动还要打四周 学者:达成目标需"补枪"

头条要闻

特朗普称对伊行动还要打四周 学者:达成目标需"补枪"

体育要闻

“想要我签名吗” 梅西逆转后嘲讽对手主帅

娱乐要闻

美伊以冲突爆发,多位明星被困中东

财经要闻

金银大涨 市场仍在评估冲突会否长期化

汽车要闻

国民SUV再添一员 瑞虎7L静态体验

态度原创

旅游
教育
游戏
公开课
军事航空

旅游要闻

火龙巡夜,花灯入梦:在韶关湾头古村,看见四百年的中式浪漫

教育要闻

26考研调剂小程序已上线,调剂快人一步!

手握357灵第一无级别神链!梦幻西游东海渊能否剑指神威第一?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国中央司令部透露对伊朗动武全部武器装备清单

无障碍浏览 进入关怀版