第 3 回: コメント --- セッションリスト 第 1 回: 導入と原則 - https://speakerdeck.com/munetoshi/code-readability-session-1-ver-2-ja 第 2 回: 命名 - https://speake…
タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。
はじめに 先日、kaggleのCommonLit Readability Prizeというコンペに参加しました。 このコンペの目的は、 アメリカの教育現場における、3年生から12年生のクラスで使用する読み物の複雑さを評価するアルゴリズムを構築すること というものでした。 現状の課題は以下のように説明されていました(DescriptionをDeepLで翻訳)。 現在、ほとんどの教育用テキストは、伝統的な読みやすさの方法や市販の計算式を使って読者に合わせています。しかし、それぞれに問題があります。Flesch-Kincaid Grade Levelのようなツールは、テキストのデコーディング(単語あたりの文字数や音節数など)や構文の複雑さ(文章あたりの単語数など)の弱い指標に基づいています。そのため、構成要素や理論的妥当性に欠けています。また、Lexileのように市販されている計算式は、コストが
code-readability-links.md Code readability presentation links English version Session 1: Introduction and Principles - https://speakerdeck.com/munetoshi/code-readability-session-1-ver-2-en Session 2: Naming - https://speakerdeck.com/munetoshi/code-readability-session-2-ver-2-en Session 3: Comments - https://speakerdeck.com/munetoshi/code-readability-session-3-ver-2-en Session 4: State - https://sp
先日Cloudflare Workersでウェブページの本文を抽出したくなったことがありました。本文抽出といえば、@mozilla/readabilityが使えそうです。しかし依存に含まれるnwsapiにはFunctionコンストラクタが多用されており*1、Cloudflare Workersでは動作しません。これを修正するのも大変そうです。 そこで、TinyGoを使用してgo-readabilityをwasmにコンパイルしてみることにしました。 TinyGo のドキュメントUsing WASM | TinyGo のままではCloudflare Workersでは動かなかったので、TinyGoに含まれるwasm_exec.jsを少し修正したり*2、 import側もwasmファイルをfetchしているのを変更したり*3すると無事動きました。 動作するコードは https://github.
現状、最低限動いてはいるけどガバガバ Readability.js とは HTML から本文を抽出するライブラリ。 元々はArc90によって開発され、現在はMozillaのFirefox Reader View に使われている。 AIモデルではなくルールベースだが、かなり精度がでる。 自分はこれを AI に食わせるサマリを作るのに愛用していたのだが... DOM API 依存と Cloudflare でJSDOMが動かない問題 DOM API に依存しているので、 jsdom に依存してしまう。 import { JSDOM } from "jsdom"; import { Readability } from "@mozilla/readability"; import html2md from "html-to-md"; function getExtractContent(htmlC
Can we emulate the upcoming CSS contrast-color() function via CSS features that have already widely shipped? And if so, what are the tradeoffs involved and how to best balance them? Relative Colors Out of all the CSS features I have designed, Relative Colors aka Relative Color Syntax (RCS) is definitely among the ones I’m most proud of. In a nutshell, they allow CSS authors to derive a new color f
8月2日に終了したKaggle「CommonLit Readability Prize」コンペにチームで参加し、25位でした。 3682チーム参加で、17位までが金メダル圏内で、もう一歩という結果でした。 コンペ概要 チームでの取り組み 上位解法 全体共通の傾向 1位 2位 3位 4位 5位 6位 9位 12位 13位 14位 15位 16位 コンペ概要 英語の文章の「読みやすさ」の値を-3から3程度の範囲(大きいほど読みやすい)*1で予測する問題でした。 正解の値は、2つの文章の比較結果を利用する「Bradley–Terry model」*2で付けられていたそうです*3。 推論時は文章単体に対してスコアを予測する必要がありました。 データセットのサイズは小さく、学習用データセットが約3000で、評価用データセットが2000*4以下でした。 与えられたデータセットのカラムは、以下の通りです
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く