51-61 CVPR 2024 最佳论文 | Rich Human Feedback for Text-to-Image Generation 2024-06-26 dba, 人工智能, 数据库 133人 已看 受大模型中RLHF技术启发,团队用人类反馈来改进Stable Diffusion等文生图模型,提出了先进的RichHF-18K数据集和多模态RAHF模型。
【DBA早下班系列】—— 并行SQL/慢SQL 问题该如何高效收集诊断信息 2024-06-11 dba, 数据库, sql 62人 已看 OceanBase论坛问答区或者提交工单支持的时候大部分时间都浪费在了诊断信息的获取交互上,今天我就其中大家比较头疼的SQL问题,给大家讲解一下如何一键收集并行SQL/慢SQL所需要的诊断信息,减少沟通成本,让大家早下班。
【RLHF个人笔记】RLHF:Reinforcement Learning from Human Feedback具体过程 2024-05-29 dba, 笔记, 人工智能, ffmpeg, 数据库 50人 已看 【RLHF个人笔记】RLHF:Reinforcement Learning from Human Feedback具体过程RLHF训练的三个步骤步骤1:收集数据与有监督训练策略步骤2:收集数据训练奖励模型步骤3:结合奖励模型利用强化学习算法如PPO算法来优化策略参考内容
Role的权限 role_sys_privs not dba_sys_privs 2024-05-22 dba, 数据库 28人 已看 union allPRIVILEGEPRIVILEGECHANGESCAUSESOLUTION。