跳至主要内容

豆瓣爬某个贴子的所有刮刮乐答案python代码

请直接複製

cookie可能会过期,如果过期,请开启你的豆瓣网页,在搜索栏查question,然后再随意点击一个id,在Header中得到Cookie複製并更新即可运行代码




from selenium import webdriver

from selenium.webdriver.common.by import By

from selenium.webdriver.chrome.options import Options

import time

import requests

import json

import urllib.parse


# 设置Chrome选项,启用Headless模式

chrome_options = Options()

chrome_options.add_argument('--headless')  # 不显示浏览器界面


# 初始化 WebDriver

driver = webdriver.Chrome(options=chrome_options)


# 让用户输入网址

url = input("请输入目标网页的网址:")


# 打开目标网页

driver.get(url)


# 等待页面加载

time.sleep(5)


# 从页面中提取所有的data-id

data_id_elements = driver.find_elements(By.XPATH, "//*[@data-id]")


# 提取所有的data-id,并过滤非7位数的

data_ids = [

    element.get_attribute("data-id") for element in data_id_elements

    if len(element.get_attribute("data-id")) == 7 and element.get_attribute("data-id").isdigit()

]


# 打印出所有符合条件的data-id

print(f"Found valid 7-digit data-ids: {data_ids}")


# 请求头信息,用于模拟浏览器请求

headers = {

    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36',

    'Accept': 'application/json, text/plain, */*',

    'Accept-Encoding': 'gzip, deflate, br',

    'Accept-Language': 'zh-TW,zh;q=0.9,en-US;q=0.8,en;q=0.7',

    'Origin': 'https://www.douban.com',

    'Referer': url,  # Referer设置为当前页面

    'Cookie': 'll="108288"; bid=jP_4GbIX6kY; viewed="27074037_1064707_26286751_1075531_1274150_35812342_3260802_4088776_26883044_1227981"; __utmv=30149280.17175; __utmz=30149280.1718796391.6.4.utmcsr=caiyawang.xyz|utmccn=(referral)|utmcmd=referral|utmcct=/; __utma=30149280.2101830697.1717257027.1718796391.1719232678.7; douban-fav-remind=1; ap_v=0,6.0; ct=y; dbcl2="171753000:NVy4yxfFedE"; ck=1unP; push_noty_num=0; push_doumail_num=0; frodotk="1aecf9763222a8cc50c6ec629667fa64"',  # 替换成真实的cookie

}


# 定义获取correct_answer的函数

def get_correct_answer(data_id):

    # 构造API请求URL

    url = f"https://m.douban.com/rexxar/api/v2/ceorl/poll/question/{data_id}?ck=1unP"

    

    try:

        # 发送GET请求

        response = requests.get(url, headers=headers)

        

        # 检查响应是否成功

        if response.status_code == 200:

            # 解析JSON响应

            response_data = response.json()

            correct_answer_unicode = response_data.get("correct_answer", "")

            

            if correct_answer_unicode:

                # 解码Unicode字符

                decoded_answer = urllib.parse.unquote(correct_answer_unicode)

                return decoded_answer

            else:

                return "No correct_answer available"

        else:

            return f"Failed to fetch data for ID {data_id}, Status Code: {response.status_code}"

    

    except requests.exceptions.RequestException as e:

        return f"Request failed for ID {data_id}: {e}"


# 遍历所有的data-id并获取correct_answer

for data_id in data_ids:

    print(f"Fetching correct_answer for data-id: {data_id}")

    correct_answer = get_correct_answer(data_id)

    print(f"Correct Answer: {correct_answer}")


# 关闭浏览器

driver.quit()


评论

此博客中的热门博文

520策划之剪辑成品及步骤记录

成品︰ 【夭柳|半世游】 下面是剪辑过程的记录,如果你也零基础 ( 好像我这剪辑软件都是当场下载的 ) 想剪一条片出来可以参考一下 我是 51 假期想剪条片来玩的,大约剪了半个月   (1) 得到三无柴 ( 即无字幕 / 水印 / 台标 ) 首先,去微博 「角色单人 cut 」 超话搜相柳 / 夭柳 / 长相思拿三无柴   我搜夭柳没找到双人柴,所以我去搜了相柳,有相柳的肯定不会漏夭柳嘛   搜相柳的前两条就有两位太太提供相柳个人三无柴的贴子,分别是檀情和灰野与青 灰野与青提供的是 4k 版本砍的三无柴,除 cut 之外还有相柳个人台词本和部分台词音频,以及其他我未用上的资源 檀情提供了 4k 和 1080p 各版本砍的三无柴,也有相柳个人台词本和全集分段台词音频,以及其他我未用上的资源   因为计算机配置,我用 1080p 更多,但 1080p 我找不到全集片源,所以也找不到小夭单人镜头   (1.1) 如果没人分享已砍好的柴,就要自己砍 那就要拿到全集片源,我只找到了 4k 全集,应该和灰野与青太太是一个片源,有软字幕,导入剪辑软件默认不导入字幕,所以等同三无柴   然后我去砍了自己的,压缩包我也提供了,不过砍得极其粗糙,我更建议用那两位太太提供的版本,但因为砍柴超话有他们的规定,比如转赞评再取,所以我无法在这里发出来,请在超话自取   砍柴软件我用的是 LosslessCut ,是在 b 站搜教程推荐的,在 github 上的开源软件,可以在每集选取想要的片段再分批导出   (1.2) 处理台词本,方便知道砍哪些片段 我是先在 wetv 拿到了字幕文件,然后再判断哪些是夭柳场景就保留,有中断就分段,然后按这些台词去 losslesscut 选择片段,在「分集粗剪 cut 」文件夹就是这些导出的片段 字幕文件是在 https://downsub.com/zh/site/wetv/ 要的, srt 和 txt 格式都有,但因为这个网站不是我提供的,我保障不了安全,只是我用着没问题,没有推荐的意思,我在「全集台词」文件夹也有提供 txt 文件,哪个方便用哪个吧 然后 losslesscut 也可以导出 srt 文件,所以夭...

三无(无字幕无台标无水印)片源的获得

PS: 如果看不到图,可以用 https://reverse-proxy.sinleng.top/proxy/www.163344.xyz/2024/05/blog-post_30.html 这个网址,因为文章网页可以由我的域名访问,这是没有被墙的,但是图片被储存在 google 的图库,这是被墙的,所以没有 VPN 会显示不出来,我之前玩过反向代理,所以可以通过这个代理访问被墙域名,直接用上面的网址就可以了, 其他文章要是也有图片,也可以 https://reverse-proxy.sinleng.top/proxy/+( 文章网址 ) 访问,不要滥用 ( 用在其他网站上 ) 就可以了, 因为这个反向代理新建不出来,被炸了就 byebye 了 请跳到最尾更新 ( 省略试错步骤 ) 腾讯的片源只需要直接用 idm 下载 ( 不用去除台标字幕 ) ,就可以得到三无柴 !!!!! 爱奇艺和优酷我试过了,海外版用 IDM 、文件蜈蚣和猫抓都只能抓取片段,需要全程播放才能抓取所有片段来合并 MP4 ,比录屏略方便一点但不多吧,应该会有其他抓取全片的方式但我还没找到,我如果需要桃酷的三无片源应该会录屏吧,但其实我录得来菜牙网会出得更快,因为他们有抓取方式。 ____________________________________________________________________________________________________ 其实一般「角色单人 cut 」超话的三无柴就够用了,还贴心地为每个片段命名了,但有时候还是想要一些 cut 以外的镜头,那就需要得到全集片源再砍。 我最开始是在淘宝要,不过要到的是 4k 全集,体积过大都算了,我还能买外接硬盘,但砍完柴导出,整合再导出简直龟速,而且预览也卡。 所以之后我就去菜牙网了,注册会员后花 1-2 块就能要到 1080p 的全集。 不过我还是很好奇,片源是哪里来的?因为菜牙网也是人家做好了再提供出来,所以有得不到的风险,需要知道他们怎么做的? 字幕是直接在爱优腾海外版就能关掉了,但台标怎么搞?「剪刀手吐槽」超话说在海外版「扒」,怎么扒? 难道有下载链接可以绕过台标直接下载?那技术上我理解不了原理。 还是从网站找灵感吧,我之前抢票时研究了一下 interpark 网站 ( 虽然没...

520策划之更文--《夭柳的恋爱头脑战—如果相柳假装被毒倒》(下)

  小夭把他推到在地,施施然蹲下身,目光锁在他的脸庞上,又把手移到他的衣襟,指尖悠悠转动,却不急着扯开。 相柳感受到她的温度,却如堕寒窟,她比他想象的还要大胆,声音稍稍发抖:「你…你想干甚么。」 小夭微笑,玉手猛然一扯,露出了半个健壮的胸膛,但手还没停。 相柳无奈,很无奈,他明明是能动的,灵力还比眼前的人儿高出很多,他完全可以制止她。 但是,谁让他「被毒到了」呢?所以只能眼睁睁看着她的放肆。不过,他总不能任她为所欲为,毕竟他只是想哄她开心一会,而不是把他俩逼到无可挽回的境地。他们是玩伴,仅此而已。不然 ⋯⋯ 那比输了还可怕,相柳的眼珠急速左右移动,好像在代替不能动的头拨鼓般摇一样,终于想到一个两全其美的方法。 相柳继续用他发抖的声音:「你…你不会是想,鞭笞我吧?」 他装作愤怒,恶狠狠地盯着她,「不要,千万不要,你绝不能这样对我!」眼睛努力睁大,可惜没了红瞳后他的威胁就大打折扣,至少吓不到她。 小夭果然上当,抛开原定的计划,沉醉在把鞭笞之仇还回来的梦想中。 「没错!没错!好不容易有这个机会。」小夭不知从哪裹搜出一条鞭子,狞笑着走过去,居高临下看着他:「相柳大人也有今天。」 小夭试探式挥出一鞭,相柳没有喊出声,似乎无事地看着她,倔强得使她鞭笞的欲望大动。 「傻子,你又忘了情人蛊,你九分痛到我身上只有一分,但我身上一分痛到你身上可是九分。」相柳内心吐槽着,身体却诚实地抑制蛊虫,还要装作屈辱以使她更解气,其实,她的鞭打就如同挠痒吧。 小夭似乎打累了,玟小六那浑不吝的样子就窜出来了:「能打相柳大人百八十个鞭子,在下不说青史留名,也能名震大荒吧。」 相柳不忍心告诉她,以她的力气打他,累死了也伤不到他,甚至都没打裂外袍。如果她脱光了他,可以看到身上只有红痕。 不过药失效的时间还没到,他必须找到其他乐子混过去,以免她想起那个可以迫得他不得不认输的杀招。嗯,他在船上准备了五颜六色的药汁。 「我为甚么感受不到你身上的疼痛?你有灵力来抑制它?为甚么要抑制呢?」小夭冷不丁地问。 这个问题太容易回答了,相柳故作无奈:「因为你的药麻痹了我的全身,所以蛊虫也被麻痹了,你不会以为你打着我,我还会心疼你吧,你以为你是谁?」 小夭没有问到她想要的答案,哼了一声。为了掩饰她的失意,硬气道:「是吗?那我更放心施为了,反正我又不会被...