Webtagr - テクノロジーニュースダイジェスト

AppleのSiri和解金9500万ドル：マイク盗聴より誤情報？

2025-01-03

Appleは、Siriの録音データがターゲティング広告に使用されたという主張をめぐり、9500万ドルで訴訟を和解しましたが、不正行為を否定しています。著者は、広告ターゲティングの精度は、マイク盗聴よりもアプリからのデータ収集によるものだと主張しています。しかし、会話に関連する広告を偶然目撃したという逸話は、マイク盗聴に関する陰謀論を助長するでしょう。

(simonwillison.net)

テクノロジーターゲティング広告

2024年の大規模言語モデル：ブレークスルーと課題

2024-12-31

2024年は、大規模言語モデル（LLM）の分野で目覚ましい進化が見られました。複数の組織がGPT-4のパフォーマンスを上回り、モデルの効率性が劇的に向上し、個人用ラップトップでもLLMを実行できるようになりました。マルチモーダルモデルが一般的になり、音声やビデオ機能も登場しました。プロンプト駆動型アプリ生成はコモディティ化されましたが、最上位モデルへの普遍的なアクセスは数ヶ月間しか続きませんでした。エージェントはまだ実現していませんが、評価の重要性は増しています。AppleのMLXライブラリは優れていましたが、Apple Intelligence機能は期待外れでした。推論スケーリングモデルが登場し、コストを削減し、環境への影響を改善しましたが、新しいインフラストラクチャによる環境問題も提起されました。合成トレーニングデータは非常に効果的でしたが、LLMの使いやすさは依然として課題であり、知識の偏在も解消されていません。より良い批判的評価が必要です。

(simonwillison.net)

AI

アリババ、新しい視覚推論モデルQvQを発表

2024-12-25

アリババは最近、Apache 2.0ライセンスの下で新しい視覚推論モデルQvQ-72B-Previewを発表しました。AIの視覚推論能力を向上させることを目的として設計されたQvQは、推論スケーリングモデルQwQをベースに、画像処理を追加しています。画像とプロンプトを受け入れ、詳細で段階的な推論プロセスを生成します。ブロガーのSimon WillisonはQvQをテストし、ペリカンのカウントなどのタスクでは成功しましたが、複雑な推論問題では精度が低いことを発見しました。現在Hugging Face Spacesで利用可能であり、将来の計画にはローカル展開とより幅広いプラットフォームのサポートが含まれています。

(simonwillison.net)

AI 視覚推論 AIモデル

LLMベンチマーク：ペリカンと自転車

2024-12-16

Simon WillisonはユニークなLLMベンチマークを作成しました。それは、自転車に乗るペリカンのSVG画像を生成することです。この珍しいプロンプトは、既存のトレーニングデータに頼らずに、モデルの創造性をテストすることを目的としています。彼はOpenAI、Anthropic、Google Gemini、Meta（Cerebrasで動作するLlama）の16個のモデルをテストし、生成されたSVGの品質に大きなばらつきがあることを明らかにしました。一部のモデルは驚くほど良い結果を出しましたが、他のモデルは苦労しました。

(simonwillison.net)

AI 画像生成

人的イベントの時間の保存：ベストプラクティスと課題

2024-12-12

この記事では、イベントウェブサイトでイベント時間を保存するためのベストプラクティスについて説明しています。著者は、UTC時間を直接保存すると、ユーザーの元の意図や場所などの重要な情報が失われると主張しています。より良いアプローチは、ユーザーの意図した時間とイベントの場所を保存し、それからUTC時間を導き出すことです。ユーザーエラー、国際的なタイムゾーン調整、2007年のMicrosoft ExchangeのDSTアップデートなどの例は、ユーザーの意図した時間を保存することの重要性を示しています。著者は、ユーザーがイベントの時間と場所を正確に設定できるように、明確で使いやすいユーザーインターフェースを設計することを推奨しており、タイムゾーンの変更によって発生するエラーを回避するために、ユーザーの元の意図を維持することの重要性を強調しています。

(simonwillison.net)

開発時間の保存タイムゾーンユーザーエクスペリエンスイベント管理データベース