Bilibili av转bv

发布于 2020-03-24  33 次阅读


此代码以 WTFPL 开源。

UPD:之前的代码中,所有数位都被用到是乱凑的,实际上并不需要,目前只要低 6 位就足够了。(更大的 av 号需要 64 位整数存储,但是 b 站现在使用的应该还是 32 位整数,所以应该还要很久)

发现的方法:

[公式]

首先从各种渠道的信息来看,应该是 base58 编码的。设 x 是一个钦定的 av 号,查询 这些 av 号对应的 bv 号,发现 bv 号的第 12、11、4、9、5 位分别会变化。所以猜测这些是 58 进制下的相应位。

但是直接 base58 是不行的,所以猜测异或了一个大数,并且 base58 的字符表可能打乱了。经过实验,bv 号最低位相同的数,av 号的奇偶性相同,这一定程度上印证了之前的猜想。

[公式]

接下来找了一些 av 号 x,满足 x 和 x+1 对应 bv 号的第 11 位不同。设异或的数为 X,那么

[公式]
[公式]
[公式]
[公式]

由于 av 号(除了最新的少量视频)最多只有 27 bits,所以可以设 。然后可以发现 只和 和 有关,那么可以枚举这两个值(一共 种情况)然后使用上面的式子检查,就能得到若干可能的和 。

[公式]

这里我得到的可能值如下:

22 90983642
22 90983643
50 43234084
50 43234085
[公式]
[公式]

有奇有偶是因为异或 1 之后也能找到轮换表。而 则使得模 58 的余数刚好变成 减它。

我取了 b=43234084,然后处理最低位,可以得到一个字符表,即 fZodR9XQDSUm21yCkr6zBqiveYah8bt4xsWpHnJE7jL5VG3guMTKNPAwcF。

[公式]
[公式]

对于更高位,实际上还需要知道 ,这些值也可以 枚举 58 次得到 。

这时我发现,每一位的字符表是相同的(实际上只对 b=43234084 是这样的),然后再微调一下参数(上面代码中的两个 magic number 就相当于这里的 ),最后处理了一下 的情况就得到了这份代码。

作者:mcfx
链接:https://www.zhihu.com/question/381784377/answer/1099438784
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。