个人技术分享

必须记住我们学习的时间是有限的。时间有限，不只由于人生短促，更由于人事纷繁。我们就应力求把我们所有的时间用去做最有益的事情。

备案号：鄂ICP备2023027962号-1

51-61 CVPR 2024 最佳论文 | Rich Human Feedback for Text-to-Image Generation

受大模型中RLHF技术启发，团队用人类反馈来改进Stable Diffusion等文生图模型，提出了先进的RichHF-18K数据集和多模态RAHF模型。

【DBA早下班系列】—— 并行SQL/慢SQL 问题该如何高效收集诊断信息

2024-06-11
dba, 数据库, sql
143人已看

OceanBase论坛问答区或者提交工单支持的时候大部分时间都浪费在了诊断信息的获取交互上，今天我就其中大家比较头疼的SQL问题，给大家讲解一下如何一键收集并行SQL/慢SQL所需要的诊断信息，减少沟通成本，让大家早下班。

【RLHF个人笔记】RLHF:Reinforcement Learning from Human Feedback具体过程

【RLHF个人笔记】RLHF:Reinforcement Learning from Human Feedback具体过程RLHF训练的三个步骤步骤1：收集数据与有监督训练策略步骤2：收集数据训练奖励模型步骤3：结合奖励模型利用强化学习算法如PPO算法来优化策略参考内容

Role的权限 role_sys_privs not dba_sys_privs

2024-05-22
dba, 数据库
92人已看

union allPRIVILEGEPRIVILEGECHANGESCAUSESOLUTION。