差分隐私
目的:差分隐私是为了防止公开统计性质的数据后,攻击者使用排除法等手段获取某一个别数据的具体信息,造成个人隐私泄露。若数据集通过A算法处理后满足差分隐私定义,则所有人仅能使用该公开数据集的统计信息,无法确定个别数据的具体信息是什么。 定义:差分隐私本质上就是一种要求,达到该要求则可以有效保护隐私。 实现方式:对数据集添加拉普拉斯噪声是一种常见的实现方式。而拉普拉斯噪声就是满足拉普拉斯分布(和正态分布,均值分布一样是一种概率分布)的一个随机值。 学习资料: 差分隐私若干基本知识点介绍(一)-CSDN博客 差分隐私若干基本知识点介绍(二)-CSDN博客
emoticon 二义性表达在数据标注上的困难
如果 :) 在某些场景下表示讽刺而非开心,这种语义的多样性确实会对情感分析或标注任务带来挑战。为了解决这种问题,可以采取以下方法: 1. 引入上下文信息表情符号的情感含义通常依赖于上下文。例如: 今天的天气真好啊 :) —— 表示开心。 你真是太聪明了 :) —— 可能表示讽刺。 解决方法: 在标注时结合上下文信息,分析表情符号的实际含义。 使用基于上下文的深度学习模型(如 BERT、GPT 等),让模型通过上下文来推断表情符号的情感。 2. 多类别标注为表情符号引入多种可能的情感类别。例如,:) 可以同时标注为“开心”和“讽刺”,具体含义由上下文决定。 解决方法: 在标注规则中允许一个表情符号对应多个情感类别。 在模型训练时,使用多标签分类方法,让模型预测多个可能的情感类别。 3. 用户自定义规则允许用户根据具体场景自定义表情符号的情感含义。例如: 在聊天分析中,用户可以指定 :) 表示讽刺。 在社交媒体分析中,用户可以指定 :) 表示开心。 实现方法: 提供一个配置文件或接口,允许用户定义表情符号的情感类别。 在标注时优先使用用户定义的规则。 4....
无题
晚上18:30,在宿舍接到母亲的电话晚上19:00, 见到HF同学栩烨,一同吃了晚饭 小事有小事的价值,生活幸福与否全靠我们怎样解读
生活感悟
很多事情不是一帆风顺的,古人云:“天将降大任于斯人也,必先苦其心智,劳其筋骨,饿其体肤,空乏其身,行拂乱其所为,所以动心忍性,增益其所不能”,生活也是在闯关,遇到困难障碍应该想办法解决,所以人才能有所提升。 有一两位朋友,家人的支持就已经很足够了,不可能做到被100%肯定,总会有持有不同意见的。(人与人之间也讲求缘分,缘分到了,你的小错误也可以被包容) 认人很重要,志同道合也很重要,多多接触社会,见识各种各样的人有助于我们选择和什么人说什么话。 人的智商重要,但是情商更重要!因为它包括自我激励,胜败乃兵家常事,怎样处理失败与挫折区别了不同的人。 身体是革命的本钱,良好的生活习惯值得现在养起,为祖国健康奋斗五十年。 做事要分清主次,影响重大的,急迫的应当优先考虑,投入更多时间。
Overleaf 局部处理生僻字
文章开头添加以下命令 12\documentclass[UTF8]{ctexart}\usepackage{fontspec} 需要局部换字体的地方,在{...}中输入\CJKfontspec{AR PL UKai CN},例如 1{\CJKfontspec{AR PL UKai CN} 镕} overleaf上支持的所有中文字体可查看官网
Hexo 博客搭建
部署准备:linux环境 第一步,apt install 下载node, npm, git (若后续因为node、npm版本问题报错,则利用copilot提示下载新版本即可) 第二步,连接Github 12git config --global user.name "GitHub 用户名"git config --global user.email "GitHub 邮箱" Github账户上Setting-SSH and GPG keys上放pub公钥文件,本地root/.ssh下要有私钥文件 Git bash下输入ssh -T git@github.com, 输入yes 第三步创建Github Page仓库,到github上创建用户名.github.io仓库 本地安装Hexo博客程序 npm install -g hexo-cli 这一步可能出错,是因为npm,node版本问题,用报错信息问问ai应该下载哪个版本的 Hexo 初始化和本地预览 12hexo init # 初始化npm install # ...
Flex与Bison用法
flex 编写a.lex文件 1234567891011121314151617181920212223242526%{int wordCount=0;int numcount=0;%}chars [A-Za-z\_\'\.\"]numbers ([0-9])+delim [" "\n\t]whitespace {delim}+ words {chars}+ %% while {printf("%s\n",yytext);}{words} { wordCount++; /* increase the word count by one*/ } {whitespace} { /* do nothing*/ } ([0-9])+ { numcount++; /* one may want to add some processing ...
Linux 权限、文件夹删除、更新软件源列表
Linux 权限、文件夹删除 给shell script文件加权限 1234ls -lchmod +x run.shls -l./run.sh 非空文件夹删除 1rm -rf dir_name 更新软件源列表sudo apt-get update
强化学习--贝尔曼方程
贝尔曼方程$$\begin{gather}v_{\pi}(s)=\sum_{a,s’}\pi(a|s)p(s’|s,a){r(s,a,s’)+\gamma v_\pi(s’)}\end{gather}$$ $$\begin{gather}q_\pi(s,a)=\sum_{s’}p(s’|s,a){r(s,a,s’)+\gamma \sum_{a’}\pi(a’|s’)q_\pi(s’,a’) }\end{gather}$$ 贝尔曼最优方程$$v_*(s)=\mathop{max}\limits_{a} \sum_{s’}p(s’|s,a){r(s,a,s’)+\gamma v_*(s’)}$$ $$q_*(s,a)=\sum_{s’}p(s’|s,a){r(s,a,s’)+\gamma \mathop{max}\limits_{a’}q_*(s’,a’) }$$ 最优策略$$\begin{gather}\begin{split}\mu_*(s) & =\mathop{argmax}a\ q(s,a) \ ...
阿里云实验经验
新用户300元试用,要实名认证,支付宝账号 实例选择2GB示例2400小时,4GB实例1200小时 但是2G不太够用,容易内存爆满导致vscode直接断连了,且必须重启服务器才可以恢复连接,十分麻烦(有时服务器抽风要7分钟以上才能关闭) vscode常见配置 首先免密登录,本地ssh-key,上传公钥pub到服务器~/.ssh/authorized_keys,本地vscode使用IdentityFile配置即可 code runner 扩展, 配置命令python的execution map 交互式窗口运行python文件,以便显示图像(需要下载jupyter等扩展,根据提示下就行
