自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Stata连享会

连玉君老师团队 - 主页 lianxh.cn

  • 博客(1388)
  • 资源 (1)
  • 收藏
  • 关注

转载 AI自动生成研究假设,靠谱吗?流程与挑战

AI假设生成, 大语言模型, 机器学习, LLM, Prompt设计, Transformer, Ludwig, Mullainathan, Batista, AI工具, ChatGPT

2025-06-01 23:14:57 19

转载 AI工具!AI工具分类大集合

AI助手, ChatGPT, DeepSeek, Kimi, 通义千问, 文心一言, 豆包, AI tools

2025-06-01 23:10:59 13

转载 Kaggle-数据科学平台:找数据、搜代码一网打尽

数据科学, Python数据集, Jupyter Notebook, 数据分析, 机器学习, Python, R语言

2025-06-01 23:08:37 15

转载 R+Stata:两部模型的理论和实操-twopm

本文介绍了R和Stata中两部模型(TPM)的实现方法,用于分析零值过多的数据。TPM通过Logit/Probit模型预测事件是否发生,然后在非零子样本上使用回归模型估计具体数值。文章以医疗费用数据为例,展示了数据预处理、模型拟合及结果解释的全过程,为医疗经济学、消费行为等领域的研究者提供了实用工具。文中包含完整的R和Stata代码,便于读者直接应用。

2025-05-28 22:41:42 34

转载 AI助手系列:借助AI工具复现高质量图形

可视化是数据分析中的核心环节。许多时候,我们会遇到一些设计精巧、细节丰富的图形,想要用代码复现却无从下手,尤其是面对复杂的布局和专业的标注,往往需要反复调试才能还原原图效果。

2025-05-27 22:52:02 30

转载 IV:形形色色的IV

本文摘译自Wu等人(2022)的综述文章,系统梳理了工具变量(IV)在因果推断和机器学习领域的最新研究进展。工具变量方法通过满足相关性、排他性和独立性三个基本假设,有效应对未观测混杂因素的挑战。传统方法如两阶段最小二乘法(2SLS)存在线性假设强、难以处理非线性关系等局限。近年来,深度学习方法如DeepIV、KernelIV、DualIV等通过引入神经网络、核方法和对偶优化等技术,显著提升了工具变量方法的灵活性和适用性。特别是DeepIV,通过两阶段深度神经网络建模处理变量的条件分布并估计因果效应,展现了强

2025-05-21 19:07:30 34

转载 R 语言绘制供需曲线指南

本文介绍了如何使用R语言中的ggplot2和Hmisc包绘制经济学中的供需曲线图。首先,作者详细说明了如何安装和加载必要的R包,包括ggplot2、dplyr和Hmisc。接着,通过Hmisc包中的bezier函数生成平滑的供给曲线,并使用ggplot2进行绘制。随后,作者展示了如何创建多条不同形态的供给曲线,并将它们合并到同一图表中进行可视化。文章最后提醒读者,若页面无法正常显示数学公式和代码,建议阅读原文以获得更好的阅读体验。

2025-05-19 10:44:36 27

转载 R:常用数据处理函数可视化解读

本文由李长生编写,主要介绍了R语言中常用数据处理函数mutate、summarize、group_by和ungroup的可视化解读。文章提供了这些函数的动画演示文件,并通过penguins数据集展示了如何在实际操作中应用这些函数。mutate函数用于向数据框中添加或替换列,可以通过.before或.after参数控制新列的位置。文章强调了这些函数的非破坏性操作特性,即在添加新列时保留原有数据。读者可以通过下载动画文件更直观地理解这些函数的使用方法。

2025-05-18 23:25:48 27

转载 Stata:带有样本选择的分位数回归-arhomm-qregsel

本文介绍了在Stata中实现带有样本选择修正的分位数回归方法,主要基于Arellano和Bonhomme(2017)的估计器。样本选择偏误在实证经济学中是一个常见问题,特别是在分析工资和就业数据时,传统回归模型可能因仅观察到部分样本而产生偏差。本文提出的方法通过引入copula函数来修正分位数回归模型中的样本选择偏误,从而提供更准确的分布估计。该方法的核心在于使用旋转“检验”函数来调整分位数水平,并根据样本选择强度进行校正。文章还详细介绍了样本选择模型的建模过程,包括潜在结果、参与决策方程和观察结果的公式,

2025-05-14 22:13:49 61

转载 2025年学术研究中的15大最佳AI工具

本文摘译自《Nature》2025年封面文章《AI for research: the ultimate guide to choosing the right tool》,介绍了15款在学术研究中广泛应用的AI工具。这些工具涵盖了从文献检索、实验设计到数据分析、学术写作等多个环节,帮助科研人员提高效率并专注于创新。文章详细介绍了ChatGPT和Claude两款工具的核心功能及使用场景,展示了它们在生成研究假设、优化论文结构和语言表达方面的优势。通过这些AI工具,研究者能够在复杂的学术环境中更高效地完成工作

2025-05-12 15:37:51 59

转载 Python-EconML包:快速上手动态双重机器学习

Python-EconML包:快速上手动态双重机器学习

2025-05-11 23:40:13 57

转载 Stata:组间边际效应差异检验-mecompare命令

本文介绍了在社会科学研究中比较不同模型预测和边际效应的重要性,尤其是处理非线性模型(如logit和probit模型)时的复杂性。传统方法难以直接比较不同模型的回归系数,因此需要一种通用且灵活的方法。文章详细回顾了边际效应和离散变化的表示方法,如代表性边际效应(MER)、平均边际效应(AMEs)、代表性数值的离散变化(DCR)和平均离散变化(ADC)。此外,文章还讨论了组内预测值和效应的比较方法,包括Wald检验统计量的计算,用于检验不同组别间预测值或效应的差异。通过这些方法,研究者可以更准确地理解和比较不同

2025-05-11 23:36:42 46

转载 找不到IV?如何借助大语言模型寻找工具变量

内生性是因果推断中最关键的问题,在处理内生性问题的方法中,工具变量是最常用的方法之一。但寻找有效的,还要满足排他性限制 (exclusion restrictions) 的工具变量,主要依赖于作者的说理论证,这一过程对写作者的说理能力和创造力的要求是很高的。因此,本文提出利用大型语言模型 (LLMs)来辅助发现新的工具变量。作者认为,使用大语言模型搜索工具变量有如下好处:第一,在特殊的论文情景下,实现快速搜索工具变量;第二,与大语言模型互动,可以在自己的研究领域发现更多新的工具变量;

2025-05-08 11:06:14 53

转载 文献追踪神器:Research Rabbit 使用指南

Research Rabbit 是一款基于文献关系图谱的探索工具,帮助你发现、追踪和管理学术文献。相较于传统数据库,Research Rabbit 更强调文献之间的网络关系,让你在“图”中读文献,在“图”中找线索。

2025-05-07 23:30:21 203

转载 给经济学研究者的Prompt Engineering指南:如何用AI高效构建研究假设?

给经济学研究者的Prompt Engineering指南:如何用AI高效构建研究假设?

2025-05-06 23:31:24 52

转载 从“能看”到“好懂”:科研图表设计的原则和建议

一张图片胜过千言万语。随着网络新闻、博客和社交媒体的兴起,一张好的图片可以承载的信息越来越多。为更好传播经济学研究,学者们都应该花时间思考如何构建引人入胜且有效的图表。那一幅有效的图表应满足什么条件呢?关键在于充分利用大脑的“前注意视觉处理(pre-attentive visual processing)”功能,即人眼只能检测有限的视觉特征,如形状或对比度,当看到一个图表时,人眼会轻易地将图表的这些特征组合起来,并在无意识间就将它们感知为一个整体图像。

2025-05-05 23:59:04 53

转载 如何借助 AI 工具来伴读一篇理论类的论文?

我是如何借助 AI 工具来伴读一篇理论类的论文的。今天读的论文不算太难:寇宗来、毕睿罡、查存. (2020). 融资约束对企业广告和研发策略的影响:理论与经验证据. 《世界经济》, 43 (4), 28–51.有兴趣的读者也可以尝试把本文的提示词丢给或,体验不同 AI 工具的表现。

2025-05-02 22:30:14 39

转载 论文复现:合成控制法需要做哪些假设检验?

Reynaerts, J., J. Vanschoonbeek,本论文的实证分析部分系统涵盖了合成控制法主流的检验方法,包括政策效果的标准误、p 值和置信区间的计算。此外,作者还详细展示了多案例合成控制法的实现过程,为相关实证研究提供了全面的参考范例。

2025-04-30 23:17:55 37

转载 提示词!用 DeepSeek 快速生成更优代码

自然语言编程」与 Python 编程、C++ 编程并不存在本质区别 —— 都是向计算机发出指令,要求其执行特定的操作。不同之处在于,Python 编程、C++ 编程等编程语言有着严格的语法规则和结构化的语法,而自然语言编程则是用人类的自然语言(如中文、英文)来描述计算机要执行的操作。因此,虽然在开始阶段,大家会感觉自然语言编程比 Python、C++ 等编程语言更简单,但实际上,想要发挥自然语言编程的真正潜力,最重要的是你的思维方式和沟通方式 (如何提问题)。提示词」可以视为「自然语言编程」的代码。

2025-04-29 22:07:39 50

转载 Python常用包盘点:经济与金融领域的必备工具包

截至 2024 年 5 月 6 日,Python 社区已发布超过个包(),涵盖了从科学计算、数据分析到机器学习、Web 开发的几乎所有领域。用户可通过进行查找和安装。然而,对于经济、金融、管理、社会科学等领域的初学者来说,要在如此庞大的生态中快速识别出高效实用的工具包,并不容易。

2025-04-28 23:11:27 49

转载 DeepSeek对话可以分享了!

DeepSeek 很方便,但是不支持分享对话 (ChatGPT 和豆包都支持)。虽然 DeepSeek 的开发人员声称会在未来的版本中添加此功能 (issue 308),但估计还需要等一段时间。今天,给大家分享一个 Goole 浏览器 Chrome 插件,让我们可以轻松分享 DeepSeek 的对话。

2025-04-28 23:07:17 111

转载 论文复现:变斜率面板数据模型 MO-OLS-气候变化与农业产出

Keana & Neal (2020) 使用 MO-OLS 估计方法 (允许斜率可以同时随时间和截面变动,即 β→βitβ→βit​),研究了未来气候变化对美国农业生产力的影响。为了说明生产力对不同天气条件的适应性 (Adaptation ),实证中考虑天气与作物产量之间的空间和时间变化是十分重要的。

2025-04-16 23:45:03 50

转载 No Chinglish:学术写作中的中式英语陷阱

AI工具, 英文学术论文, 英文论文, 中文直译, AI工具系列

2025-04-12 23:51:40 54

转载 AI工具系列:英文学术论文语法检测与纠正

在英文学术论文写作过程中,AI工具的使用可以显著提高写作效率和表达质量。本文将为博士生和高校青年教师推荐一系列实用的AI写作工具,重点涵盖语法优化、学术论文辅助、论文格式和术语规范化等方面,帮助读者在写作过程中减少重复劳动,提升写作质量,满足高水平的学术要求。

2025-04-11 23:34:09 46

转载 老连买电脑:ChatGPT,DeepSeek,豆包来帮忙

连玉君 (中山大学)。我准备用 R 来讲,还要手写板书,演示如何借助 AI 助手进行数据分析、编写代码。要想实现这些要求,就必须在教室的电脑上预先安装一堆软件,很麻烦。因此,我决定买一个笔记本电脑,上课时直接投影到到屏幕上即可。好多年没有买过笔记本电脑了,对于配置之类的完全没有概念。于是,我打开京东,简单浏览了一下,粗选了 8 款电脑,然后开始同时和三个臭裨将 (ChatGPT,DeepSeek,豆包) 聊天,帮我作出决定。

2025-04-09 22:50:51 64

转载 同伴效应研究中的关键指标:Peer Mean 的计算方法

在社会科学和经济学研究中,是一个常见的研究话题,指的是个体的行为、成绩或决策受到他人群体行为的影响,参见),et al. (), 连玉君等 (), 杨海生等 (为了定量衡量这种影响,(同行平均值)是一个常用的统计量,它表示某个个体在同行群体中的平均表现。本文将介绍两种常用的计算的方法,并说明如何使用 Stata 来实现这一计算。与此同时,基于数学公式,R 和 Python 用户也可以很容易地编写代码来计算该指标。

2025-04-09 00:06:14 46

转载 异质性分析:如何避免“事后看碟下菜”?

在经济与金融学的实证研究中,异质性分析(heterogeneity analysis)几乎已成为论文结构中的“标配”环节。研究者普遍意识到,若要对主效应进行进一步的机制识别或条件检验,往往需要设计一系列分组回归、交互项设定等异质性分析策略。这种分析的意义远不止是“多做几个结果”或“列出更多稳健性检验”。它在理论机制的验证、因果识别的加强,以及政策含义的提炼等多个层面,都能为论文提供实质性的支撑。当然,实证研究中我们始终秉持大胆假设、小心求证。

2025-04-07 23:01:13 117

转载 GMD:最新全球宏观数据库-243个国家46个宏观变量

全球宏观数据库GMDGMD是一个开源、持续更新的宏观经济统计数据库。通过整合来自 32 个主要国际组织(如 IMF、世界银行、OECD)和 78 个历史数据集,GMD 构建了覆盖 243 个国家、46 个宏观经济变量的年度时间序列。这些数据从 1086 年延续至 2024 年,并包含对 2025-2030 年的预测数据。这一数据集覆盖了从现代数据收集的起源到 2030 年的预测,提供了全球宏观经济趋势的全面视角。它可以为研究人员提供跨国比较、长期趋势分析和政策评估的基础工具。

2025-04-07 22:58:20 76

转载 异质性分析:揭示理论成立的边界条件

在经济与金融领域的实证研究中,异质性分析已成为论文的重要组成部分。它的目的不仅是为了“丰富实证结果”,更关键的是:帮助我们识别理论机制在哪些条件下才成立、在哪些群体中更强。在理论建模中,我们经常会设定一组先验假设,比如企业是否面临融资约束、市场是否完全竞争、信息是否对称等等。这些假设构成了理论成立的基础条件。如果在现实数据中这些条件不成立,那么模型的预测也很可能不成立。异质性分析的一个主要任务,就是用数据来检验这些边界条件。

2025-04-05 20:27:51 73

转载 可重复研究:世行经济学家对论文复现的要求

本文介绍了世界银行经济学家在论文复现方面的具体要求及核查清单。复现研究是验证并重现学术研究成果的关键步骤,旨在确保这些研究的可靠性和可重复性。作为全球领先的研究与政策制定机构,世界银行为其经济学家发表的论文设定了严格的复现标准和程序。下面将详细介绍世界银行经济学家在准备论文时需遵循的复现指南及相应的核查清单,以保证其研究工作的透明度和严谨性。

2025-04-05 20:25:45 70

转载 Stata:更适合中国的坐标命令-cngcode-cnaddress

Sata 绘图,cngcode,cnaddress,BD09II,百度地图,中国地理编码

2025-04-03 14:18:25 63

转载 Big-Bad-Bank并不稳健:DID元老级文献的脆弱

近年来,在因果识别研究中,双向固定效应 (TWFE) 交错双重差分 (DID) 方法的可信性受到了广泛关注。针对其在政策效应评估中的稳健性,Baker 等 (2022) 以 DID 经典文献(BLL) 为例,复现了部分核心结果,并进一步检验了新兴 DID 方法的稳健性。这些新方法旨在修正因处理时点差异和处理效应异质性所导致的偏差。本文重点关注 Callaway 和 Sant’Anna。

2025-04-01 23:33:43 71

转载 如何获取 R 的帮助:从入门到进阶

R语言, R帮助, R books, R 语言, R 软件

2025-03-31 23:52:49 28

转载 匹配使用指南:通过数据预处理降低模型依赖

匹配,因果效应,模型形式,倾向得分,精确匹配,模糊匹配,参数估计

2025-03-30 23:48:22 36

转载 Stata:考虑衡量偏误的生产函数估计-robustpf

本文提出了一种新的方法来识别和估计生产函数。作者放宽了对代理变量标量不可观察的假设,并采用 GMM 方法来解决生产函数估计中的问题。该方法在智利食品行业的案例研究中得到了验证,并取得了可行的结果。该程序可通过 Stata 的robustpf命令运行。

2025-03-29 23:01:28 31

转载 论文复现:气候变化对美国农业产出的影响

Keana and Neal (2020) 探讨了未来气候变化对美国农业生产力的影响。为分析生产力对不同天气条件的适应性 (Adaptation),实证研究强调了天气与作物产量在空间和时间上变动的重要性。农作物产量受气候变化影响的程度,取决于农民的适应能力,如使用耐热杂交种子、增强田间保水性、实施灌溉或优化播种密度等。历史数据表明,这种适应性在生产中呈现显著的空间和时间异质性。为此,作者通过生产函数的截距与斜率捕捉这种异质性,以更准确描述适应能力对农业生产力的影响。

2025-03-29 22:55:51 43

转载 美国生命末期健康照护预测建模

机器学习模型,医疗保健支出,医保,死亡风险预测,machine learning,随机森林,梯度提升回归树, LASSO,集成学习

2025-03-28 09:00:37 61

转载 AI助手系列:napkin.ai-文字转换为图片和表格

napkin.ai 是一款基于 AI 的图形生成工具,能够根据用户提供的文字脚本,快速生成适合幻灯片或博文的插图。无论是学术流程图、数据分析图示,还是概念解释图,napkin.ai 都能通过简单的文本输入,自动生成高质量的图形。

2025-03-25 23:37:10 77

转载 Stata 地图:cntraveltime-助你足不出户丈量中国

地理距离经常被用作经济学研究中的解释变量。距离基于大圆公式,称为大地距离。一般来说,两个地点之间的大地距离越大,通信成本(可以指时间花费)越高。然而,大地距离不能准确地表示实际的行程距离,因为两个地点之间的通行时间通常因受到地点内的山川河流、道路状况和气候等地理条件影响,大地距离难以有效衡量通行成本。因此,该领域的现有文献建议进一步研究更贴近现实的距离测量。现有关距离测量的命令或软件包有traveltimeOzimek 和 Miles, 2011)、mqtime)、osrmtime。

2025-03-25 23:25:28 44

转载 Stata:如何永久修改我的PERSONAL文件夹的位置?

profile, 个人文件夹, Stata设定, profile.do

2025-03-20 11:17:37 116

Stata101:人手一份的入门指南-连玉君

花了几天的时间,用 Markdown - Marp 做了一份幻灯片,介绍了 Stata 的基本操作,以及常用资源和链接。 这不是一份操作指南,而是一份地图,方便各位在需要的时候查阅。 封面图片是动画片「极速蜗牛」的剧照,我很喜欢这只蜗牛的励志故事。

2024-09-20

profile.do

连玉君的 profile.do 文件。下载后放置于 stata 安装目录根目录下,重启后生效。 可以通过 dofile editor 打开后按照自己的需要进行修改。

2017-09-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除