概要 LLMなどで作成されたテキストの品質を自動測定するのは難しい。 コサイン類似度やBLEUなどの手法があるが、それは人間の判断とは違いが多い。 G-EVALではタスクの導入と評価基準から評価手順をLLMで作成させた評…
概要 LLMなどで作成されたテキストの品質を自動測定するのは難しい。 コサイン類似度やBLEUなどの手法があるが、それは人間の判断とは違いが多い。 G-EVALではタスクの導入と評価基準から評価手順をLLMで作成させた評…
目的 2023-10-10より11銀行(三菱 UFJ 銀行、りそな銀行、埼玉りそな銀行、関西みらい銀行、山口銀行、北九州銀行、三菱 UFJ 信託銀行、日本カストディ銀行、JP モルガン・チェース銀行、もみじ銀行、商工組合…
背景 本稿では考察を間違えると「社会常識や人間的な感情への想像力がすっぽり抜け落ちている」と罵倒される、ごん狐について考察を行う。 今回は以下のサイトのごん狐をもとに考察するのでネタバレを懸念する方は一度、読み直してから…
はじめに Googleのバグ予測アルゴリズムというものがあります。 https://www.publickey1.jp/blog/11/post_193.html 簡単にいうと最近、数多くバグ修正したコードはバグが発生し…
プロセスのダンプファイルを取得してデバッグする方法 たとえばハングしているプロセスのダンプファイルを取得して別の環境で解析する方法について記述する。 Windowsの場合 ダンプファイルの取得方法 タスクマネージャーから…
Visual Studio 2019でリモートデバッグを行う 開発環境の入っていない端末でデバッグを行う場合、リモートデバッグを使用することができる。 以下参照 https://docs.microsoft.com/ja…
はじめに デスマーチについてのWikipediaの記述が凄く引っかかり、また、多くの人がそれを無批判に受け入れているので記事を書きます。 2020/06/07時点のWikipediaより https://ja.wikip…
PowerShellでVisualStudioを操作する VisualStudioをスクリプトで操作したい場合がたまにあります。たとえば、ソースコード中の関数の一覧を列挙したり、コードを自動生成する場合などです。 現Vi…
OGPってなんだってばよ OGPがなんだかわからなかったので調べてみました。OGPとははOpen Graph protocolの略で、以下に仕様が公開されています。 https://ogp.me/ OGPを使用することで…
概要 トスツイとは「@tos」をつけてツイートした場合に、フォロワーのタイムラインに表示されず、ツイートできるというテクニックです。 ※「ツイートと返信」には表示されますし、検索には引っかかります。 @tosで何故タイム…