网易首页 > 网易号 > 正文 申请入驻

友好的 Python:封装和复用

0
分享至

△△请给“Python猫”加星标 ,以免错过文章推送


作者:frostming

原文地址:https://frostming.com/2024/friendly-python-reuse

版权声明:本文经原作者授权 Python猫 转载,为便于阅读,排版略作编辑。版权归原作者所有,如需转载,请务必先联系原作!

最近我写了一个 TTS(Text to Speach) 库Tetos,为的就是统一各种云 TTS 服务的调用接口,让用户可以用同一套代码,只需要变动参数就可以在不同的 TTS 间切换。

项目地址:https://github.com/frostming/tetos


在实现过程中,我翻阅了很多云 TTS 服务的接口文档,发现它们接口的设计大相径庭,有的是 RESTful,有的是伪 RESTful,有的文档里甚至只让你用 SDK,没有 HTTP 接口说明。

本来嘛,我做的工作就是让用户可以不用做这些工作,但本篇文章还是想主要吐槽一下火山引擎的接口,和它的 SDK 设计。所以这篇可能不能叫《友好的 Python》了,可以当吐槽大会来看。

提出问题

假设你是一名公有云厂商 Python SDK 的开发者,你们的接口有一个非常复杂的验签机制,你人微言轻,不能质疑,只能按照上面交给你的文档来做。那么你会怎么设计这个 SDK 给用户使用?进一步,不如我们脱离签名的具体细节,把它抽象出来:

sign(request, randomData, secrets) -> signedRequest

签名的输入有三个:HTTP 请求、现场随机生成的数据,和密钥数据。输出是签名的请求,这个签名可能修改了请求头,或是请求体,我们不管它,总之后续就用这个新的请求执行。假如这个 SDK 支持的是requests库,你会怎么设计呢?不妨先带着这个思考,来

吃一口屎
看一下火山引擎的 SDK。

下面的代码是我直接从火山引擎的接口文档里截取的。(https://www.volcengine.com/docs/6489/71995#python)

class SAMIService(Service):
    _instance_lock = threading.Lock()

    def __new__(cls, *args, **kwargs):
        if not hasattr(SAMIService, "_instance"):
            with SAMIService._instance_lock:
                if not hasattr(SAMIService, "_instance"):
                    SAMIService._instance = object.__new__(cls)
        return SAMIService._instance

    def __init__(self):
        self.service_info = SAMIService.get_service_info()
        self.api_info = SAMIService.get_api_info()
        super(SAMIService, self).__init__(self.service_info, self.api_info)

    @staticmethod
    def get_service_info():
        api_url = 'open.volcengineapi.com'
        service_info = ServiceInfo(api_url, {},
                                   Credentials('', '', 'sami', 'cn-north-1'), 10, 10)
        return service_info

    @staticmethod
    def get_api_info():
        api_info = {
            "GetToken": ApiInfo("POST", "/", {"Action": "GetToken", "Version": "2021-07-27"}, {}, {}),
        }
        return api_info

    def common_json_handler(self, api, body):
        params = dict()
        try:
            body = json.dumps(body)
            res = self.json(api, params, body)
            res_json = json.loads(res)
            return res_json
        except Exception as e:
            res = str(e)
            try:
                res_json = json.loads(res)
                return res_json
            except:
                raise Exception(str(e))

if __name__ == '__main__':
    sami_service = SAMIService()

    sami_service.set_ak(ACCESS_KEY)
    sami_service.set_sk(SECRET_KEY)

    req = {"appkey": APPKEY, "token_version": AUTH_VERSION, "expiration": 3600}
    resp = sami_service.common_json_handler("GetToken", req)
    try:
        print("response task_id=%s status_code=%d status_text=%s expires_at=%s\n\t token=%s" % (
            resp["task_id"], resp["status_code"], resp["status_text"], resp["expires_at"], resp["token"]))
    except:
        print("get token failed, ", resp)
大病得治

这是一个获取 Token 的请求,最后使用的是common_json_handler()这个函数。一眼看去,你发现一点都不像正常的 Python HTTP 调用风格,你以为他是祖传自建的 HTTP 轮子,但其实不是,它底层还是requests,那么为什么 SDK 会变得这么畸形呢?

我们先忽略set_ak(),Singleton这种从别的语言过来的在 Python 里毫无必要的写法,并且也忽略他在except Exception逻辑里返回正常响应的行为(我得咬着后槽牙才能忍,这么写是要浸猪笼的)。

我第一个反对的是,为什么要用继承 +staticmethod的方法来写,我们知道 Python 里用 class 基本是要共享状态的,而用了staticmethod就没得共享了,那么为什么不能直接改成下面这样?

api_url = 'open.volcengineapi.com'
service_info = ServiceInfo(
    api_url, {},
    Credentials('', '', 'sami', 'cn-north-1'), 10, 10
)
api_info = {
    "GetToken": ApiInfo("POST", "/", {"Action": "GetToken", "Version": "2021-07-27"}, {}, {}),
}
sami_service = Service(service_info, api_info)
...

并且阅读代码可知Credentials的头两个参数就是access_keysecret_key,那么直接传入,不必后面再set_ak了。上面这个写法和之前继承 +staticmethod的效果完全一样。

好了现在除了common_json_handler()以外这个类的成员全被我干掉了,需要注意到api_info里仿佛包含的是一些请求相关的信息,依次分别是method,path,bodyheaders之类的东西。下面我们来看看怎么改掉这个函数。

common_json_handler()唯一用到的 Service 的方法是self.json(),从名字猜测这是一个接收 JSON 响应的方法,注意到 body 和 response 都分别经过了json.dumpsjson.loads,等于这个名为json()的函数啥事都要自己来干。

既然如此不要把它放在类里面了,直接拉出来写成一个函数。

def common_json_handler(service, api, body):
    params = dict()
    try:
        body = json.dumps(body)
        res = service.json(api, params, body)
        res_json = json.loads(res)
        return res_json
    except Exception as e:
         # 后面的太可怕了,不要学 
        ...

还记得直接用requests怎么发送和接收 JSON 响应吗?

res = requests.post(url, json=body)
res_json = res.json()

好优雅,好舒服,这么优雅舒服的库怎么被他包成了这样?不要忘了一开始提出的问题,要对请求签名。我们看看Service.json()的实现。

def json(self, api, params, body):
    if not (api in self.api_info):
        raise Exception("no such api")
    api_info = self.api_info[api]
    r = self.prepare_request(api_info, params)
    r.headers['Content-Type'] = 'application/json'
    r.body = body

    SignerV4.sign(r, self.service_info.credentials)

    url = r.build()
    resp = self.session.post(url, headers=r.headers, data=r.body,
                                timeout=(self.service_info.connection_timeout, self.service_info.socket_timeout))
    if resp.status_code == 200:
        return json.dumps(resp.json())
    else:
        raise Exception(resp.text.encode("utf-8"))

好家伙,难怪我要自己json.loads()呢,json.dumps(resp.json())来来来,你过来我保证不打死你。

接着看,这里出现了关键的SignerV4.sign(),参数是一个自己生成的 request 对象,和上面我抽象的差不多,需要一些请求的信息和密钥。这也是为什么要一个如此奇怪的api_info,因为这是签名需要用的请求的信息,只好单独传递。

好了问题找到了,搞这么奇怪,就是因为他自己弄了个请求对象,然后又要费劲把它变成requests接受的对象(r.build()拿 URL 及r.headers,r.body)。

那么请问下,为什么不能用requests内部的请求对象去生成签名?反正最终是要靠requests发送请求,要有的信息这全都有。就好比你跑马拉松,补给点都是在跑道必经之处,想象一下你要喝个水还要专门跑岔路去补给点,怎生一个卧槽。

尽量不要自己封装新的对象,因为你要拷贝原有的属性。

那么现在要做的事情就清楚了,就是要在请求前修改requests即将要发送的请求对象,给它加上签名信息。

这其实是一种 interceptor,requests有什么机制实现这个需求呢?我第一想到的是 Event Hook(https://requests.readthedocs.io/en/latest/user/advanced/#event-hooks),但仿佛requests没有before_request这个钩子(曾经有),那么接下来考虑的是重载,由于这个签名方法是应用在 request 对象上的,所以不同在getpost之前做文章,因为这两个方法都还没产生 request 对象呢,可以重载Session.send()这个方法:

class VolcSession(requests.Session):
    def send(self, request, **kwargs):
         # new_sign 具体实现略,照抄即可 
        new_sign(request, service_info, credentials)
        return super().send(request, **kwargs)

(重载Session.prepare_request()也是一样的效果,区别是在super()返回的对象上修改)不知对开始的问题你们心目中的方案是不是这样。

但是,我说但是了,这里最好的方法利用,requests.auth,他的签名是这样的:

class AuthBase:
    """Base class that all auth implementations derive from"""

    def __call__(self, r):
        raise NotImplementedError("Auth hooks must be callable.")

接收一个唯一对象r,这个就是即将要发送的请求,并返回一个新的请求,你可以对它作任何修改,这不就是我们要做的事情吗?签名所需的其他信息,可以作为__init__的初始化参数。那么就可以改写成:

class VolcAuth(AuthBase):
    def __init__(self, service_info, credentials):
        self.service_info = service_info
        self.credentials = credentials

    def __call__(self, r):
         # new_sign 具体实现略,照抄即可,区别是自定义的 request 对象改成了 requests 的 
        new_sign(r, self.service_info, self.credentials)
        return r

只需要这一个小小的对象即可。利用库的已存在的数据结构的好处是,我们能最大化保持原来的库的接口,因为请求方法我们没有任何侵入。用这个 Auth 对象请求的方法是:

auth = VolcAuth(service_info, credentials)
res = requests.post(url, json=body, auth=auth)

这样post()方法里的所有参数,包括data,files,headers你可以任意使用,就像用requests一样去调火山的接口,你还可以把创建一个带 auth 的Session,这样后面调用就不用每次都传auth了。无感亲肤,就像冰丝内裤一样。

对一个库的重载或修改,修改面要越小越好,并尽可能利用库本身提供的扩展方式。

这与上面的方案相比,上面需要继承Session,而利用的AuthBase本来就是提供给你扩展的,而且创建的对象 Auth 比 Session 小得多。只有当库扩展能力不足时,才考虑前面的方式,一直到无能为力,甚至动用 monkey patch 这种武器。

这里面的细微优劣,就像你想要车的某个高级功能,你是希望得到一个插到任何车上都能用的零件,还是一台升级好的车,且你不知道它改了哪里呢?

参考实现

我在 Tetos 里做了一个针对httpxAuth实现,和requestsAuth作用差不多,有兴趣的话甚至可以用一个Auth同时支持httpxrequests两个库。

https://github.com/frostming/tetos/blob/15a039f15feda2a3f7ffba7c441b5438f22a6ee4/src/tetos/volc.py#L25-L86

比较一下,这个实现 62 行,加上不超过两行的调用,实现了原来 SignerV4.py 207 行,加上 Service.py 290 行,近 500 行,还没算上 import 的公共函数,十倍的差距。可见阅读库的文档,理清逻辑,是可以大大节省代码量的。

https://github.com/volcengine/volc-sdk-python/blob/main/volcengine/auth/SignerV4.py https://github.com/volcengine/volc-sdk-python/blob/main/volcengine/base/Service.py
总结

这个 SDK 写成这样,可能是直接从别的语言直译过来的。不知从事 code review 的 @piglei 如何看待,能不能过你这关。如果阅读本文的你恰好就是维护这个 SDK 的人被我中伤了我深表抱歉,并绝对不改。

如果你觉得本文有帮助

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
土媒:穆里尼奥入主费内巴切后,引援名单已锁定至少四名球员

土媒:穆里尼奥入主费内巴切后,引援名单已锁定至少四名球员

直播吧
2024-06-16 20:24:02
高中生模仿宋徽宗瘦金体,被老师打0分,评语:不要挑战考试底线

高中生模仿宋徽宗瘦金体,被老师打0分,评语:不要挑战考试底线

熙熙说教
2024-06-16 12:08:10
菲军接到任务,对华称呼已变,中方舰队拉包围圈,仙宾礁对抗升级

菲军接到任务,对华称呼已变,中方舰队拉包围圈,仙宾礁对抗升级

说天说地说实事
2024-06-15 20:02:53
上海这夜,耍大牌周也和勒肉张碧晨,都败给了“全裹”出镜的高叶

上海这夜,耍大牌周也和勒肉张碧晨,都败给了“全裹”出镜的高叶

一娱三分地
2024-06-16 08:55:03
瑞士峰会传来消息,好家伙,幸亏中国没去参加,普京早就布好局了

瑞士峰会传来消息,好家伙,幸亏中国没去参加,普京早就布好局了

千里持剑
2024-06-15 12:53:07
最新积分榜:一场0-3让日本女排扣大分!中国女排锁定亚洲第一

最新积分榜:一场0-3让日本女排扣大分!中国女排锁定亚洲第一

刺头体育
2024-06-16 22:58:55
一天拿下4城!俄军攻入恰索夫亚尔,尸骸遍地,乌军女兵掉头就跑

一天拿下4城!俄军攻入恰索夫亚尔,尸骸遍地,乌军女兵掉头就跑

秦蓁
2024-06-14 12:10:02
江苏一股民74元追高上车爱迪尔,躺平8年,最终退市

江苏一股民74元追高上车爱迪尔,躺平8年,最终退市

惜别的海岸
2024-06-16 22:53:23
周日竞彩解析:荷兰小胜收场,丹麦恐难取胜,英格兰稳定取下3分

周日竞彩解析:荷兰小胜收场,丹麦恐难取胜,英格兰稳定取下3分

阿涛说球
2024-06-16 15:46:59
路易王子萌翻天!凯特王妃现身拥抱孩子,状态堪忧人心疼

路易王子萌翻天!凯特王妃现身拥抱孩子,状态堪忧人心疼

娱记掌门
2024-06-17 01:54:35
别再说公务员多了,我国目前公务员总数仅800万,占比只有0.57%!

别再说公务员多了,我国目前公务员总数仅800万,占比只有0.57%!

小圣杂谈原创
2024-06-15 18:55:06
“母亲借钱买的”电瓶车不合标准被没收,女孩哭得撕心裂肺!

“母亲借钱买的”电瓶车不合标准被没收,女孩哭得撕心裂肺!

走读新生
2024-06-15 07:25:14
姑娘美出高级感

姑娘美出高级感

白宸侃片
2024-06-16 10:32:55
新冠疫后,罕见癌症大增

新冠疫后,罕见癌症大增

霹雳炮
2024-06-13 23:40:49
清洗王室、囚禁生母、冷落拜登,沙特王储小萨勒曼的手段有多狠?

清洗王室、囚禁生母、冷落拜登,沙特王储小萨勒曼的手段有多狠?

我是兰兰
2024-03-20 20:04:28
姜萍走红后,姜萍妈妈社媒账号首发声:女儿正在备考,谢谢大家的鼓励与支持

姜萍走红后,姜萍妈妈社媒账号首发声:女儿正在备考,谢谢大家的鼓励与支持

鲁中晨报
2024-06-16 16:35:05
历史进入垃圾时间,心肠要硬一点

历史进入垃圾时间,心肠要硬一点

西坡原创
2024-05-07 13:03:54
纪实:91大神有什么手段?无论是大学生或空姐,全都心甘情愿出镜

纪实:91大神有什么手段?无论是大学生或空姐,全都心甘情愿出镜

玲说百态味
2024-05-08 18:09:01
他刚当市长就被老百姓指责,后来官至政治局常委,如今已经86岁了

他刚当市长就被老百姓指责,后来官至政治局常委,如今已经86岁了

李姐历史
2024-06-14 09:57:42
河北新娘抛下丈夫喝药自尽,12年后丈夫不顾一切给妻子开棺

河北新娘抛下丈夫喝药自尽,12年后丈夫不顾一切给妻子开棺

青丝人生
2024-05-20 17:32:41
2024-06-17 04:38:44
Python猫
Python猫
人生苦短,我用Python。博客:https://pythoncat.top
633文章数 8097关注度
往期回顾 全部

科技要闻

iPhone 16会杀死大模型APP吗?

头条要闻

冷藏货车违规乘人致8人窒息后遇难 河南叶县通报

头条要闻

冷藏货车违规乘人致8人窒息后遇难 河南叶县通报

体育要闻

没人永远年轻 但青春如此无敌还是离谱了些

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

打断妻子多根肋骨 上市公司创始人被公诉

汽车要闻

售17.68万-21.68万元 极狐阿尔法S5正式上市

态度原创

艺术
家居
教育
亲子
公开课

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

家居要闻

空谷来音 朴素留白的侘寂之美

教育要闻

北京高考阅卷进行中,语文已有多篇作文有望拿满分!

亲子要闻

玩这个游戏的都是勇士

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版